自然言語処理を学ぼう #6 doc2vec 実装編
前回考えた処理の流れ
- 学習データの文章を用意する
- mecab(neologd使用)でわかち書き処理
- Word2Vecまで名詞のみにしていたが、Doc2Vecは文章に対応しているので文章全部を利用する
- GensimのDoc2Vecにはmost_similarメソッドが用意されているので、それで類似した文章を見つける
参考
- gensim公式
- [gensim]Doc2Vecの使い方 Gensimのdoc2vecの使い方概要について書かれたQiita記事