自然言語処理を学ぼう #6 doc2vec 実装編

Oct 8, 2018

前回考えた処理の流れ

学習データの文章を用意する
mecab(neologd使用)でわかち書き処理
Word2Vecまで名詞のみにしていたが、Doc2Vecは文章に対応しているので文章全部を利用する
GensimのDoc2Vecにはmost_similarメソッドが用意されているので、それで類似した文章を見つける

参考

gensim公式
[gensim]Doc2Vecの使い方 Gensimのdoc2vecの使い方概要について書かれたQiita記事

実行コード

find a similar movie by doc2vec