本当にただのメモ

なるべく Qiita に投稿しよう

JS から文章から名詞を抽出したかった

要件

  • 「仕事でGo言語を書く」 → 「仕事, Go, 言語」または「仕事, Go言語」と抽出されてほしい
  • Chrome 拡張からの利用を想定

辞書ファイルのサイズ ( kuromoji.js を例)

ざっと調べた感じ、辞書ファイルが要るっぽい。嫌な予感。kuromoji.js の辞書ファイルのサイズを見てみる。

$ du -h ./dict/
 17M    ./dict/

$ ls -Slh ./dict/ | head -3
total 34816
-rw-r--r--  1 cside  staff   5.6M  3 13 06:49 tid_pos.dat.gz
-rw-r--r--  1 cside  staff   3.8M  3 13 06:49 base.dat.gz

これ全部いるの?

ちなみに自分が入れてる Chrome 拡張で一番重いのやつで 0.1 MB だった。

日本語の形態素解析ライブラリ

Search · Japanese morphological · GitHub

ありものの API の利用を検討

要件

  • (SHOULD) 10 件くらいまで bulk get できるやつが望ましい
    • ループで投げるのは流石に心が痛むので ...
  • 10,000q/day くらいは使いたい ...
    • もはや無制限のやつじゃあいと厳しい気がする

調べたやつ