自然言語処理を学ぼう #7 サービスデプロイ編
目標
これまで検証してきた言語処理の手法の中で最も文章類似度判定について精度が良さそうだったword2vecを使い、サービスを立ち上げる
構成
- flask
- Pythonの軽量ウェブアプリケーションフレームワーク
- APIを作成するのに使う
- Digital Ocean
- サービスを稼働させるサーバー
- 定額で利用出来る
- 今回は月5ドルプランを利用
Digital Oceanにした経緯
- Google App Engineでのサービス公開に挑戦し失敗
- Google App Engineにはモデルファイルがおけない(1GB)
- Google Cloud Storageに置いて読み込ませようとしたが、gensimのword2vecはパスからの読み込みにしか対応していない
- Digital OceanのCommunityにやりたいことに近い情報が公開されていた
作り方
- REST API化
- DigitalOceanの設定
実際の動き
文章のIDを受け取って、JSON形式で類似文章を返す
※動画公開時にはサービスを潰しています