メインコンテンツまでスキップ

自然言語処理に用いるツール

形態素解析

MeCab

  • https://taku910.github.io/mecab/
  • 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としている
  • 非常に高速に動作する
  • 単語の発生しやすさ(生起コスト)と品詞の繋がりやすさ(連接コスト)から、コストが最も小さくなる解析結果を出力する

JUMAN

JUMAN++

Sudachi

Janome

  • https://mocobeta.github.io/janome/
  • Pure Python で書かれた辞書内包の形態素解析ライブラリ
  • 依存ライブラリが少ないがまだ開発途上感あり

係り受け解析

CaboCha

ライブラリ

GiNZA

  • https://megagonlabs.github.io/ginza/
  • 2019/4/2公開
  • 形態素解析、係り受け解析、単語依存構造解析の機能を持つ
  • spaCyをフレームワークとして利用しており、SudachiPyを内部に組み込んでいる