先日「なろう度偏差値計算機」なるものを作った管理人ですが、今流行りのディープラーニングを用いたらもっとよさげなのが出来そうと思い立ち、さっそく作ってみました。今回はTensorFlow + Kerasを使用しています。
学習データは「小説を読もう!」=なろう小説、「星空文庫」=なろう小説でない、として各10000タイトルずつ学習しています。詳しいソースコードは完成したら解説するつもりですが、とりあえずいい感じに学習できたことを報告しておきます。
モデルをいろいろ改良し、最終的にテスト用データでの正解率が93%程度になりました。試しにいくつかの小説タイトルを試してみたらそれなりに判定できていたので、ソースコードを整理した後、ホームページ埋め込みと解説記事を投稿しようと思います。
コメント