MeCab

MeCabは京都大学情報学研究科と日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジンである.特徴として,辞書,コーパスに依存しない,条件確率確率場CRFに基づく高い解析性能と考えられる.過去の研究ではMeCabで単語を分割する.そして,名詞の識別もMeCabでできる.入力の例と出力の例を以下で示す.

\begin{itembox}[l]{入力の例:}
\par
自然言語処理は、人間が日常...
...コンピュータに処理させる一連の技術である.\\
\end{itembox}

\begin{itembox}[l]{出力の例}
自然 名詞,形容動詞語幹,*,*,*,*,自...
...*,五段・ラ行アル,基本形,ある,アル,アル\\
EOS\\
\end{itembox}