目標

これまで検証してきた言語処理の手法の中で最も文章類似度判定について精度が良さそうだったword2vecを使い、サービスを立ち上げる

構成

  • flask
    • Pythonの軽量ウェブアプリケーションフレームワーク
    • APIを作成するのに使う
  • Digital Ocean
    • サービスを稼働させるサーバー
    • 定額で利用出来る
    • 今回は月5ドルプランを利用

Digital Oceanにした経緯

  • Google App Engineでのサービス公開に挑戦し失敗
    • Google App Engineにはモデルファイルがおけない(1GB)
    • Google Cloud Storageに置いて読み込ませようとしたが、gensimのword2vecはパスからの読み込みにしか対応していない
  • Digital OceanのCommunityにやりたいことに近い情報が公開されていた

作り方

実際の動き

文章のIDを受け取って、JSON形式で類似文章を返す

※動画公開時にはサービスを潰しています