next up previous contents
次へ: 固有表現抽出 上へ: 基本技術 戻る: シソーラス   目次

形態素・構文解析

形態素解析は文章を意味のある単語に区切り,辞書を利用して品詞や内容を判別することである. ソフトとしてはChaSenやMeCabなどがある. 構文解析は,文節間の係り受け構造を発見することである. ソフトとしてはKNPやCaboCha[7]などがある. 本実験ではCaboChaを用いる. CaboChaはSVMに基づく日本語係り受け解析器である. 入力文から単語境界,品詞,固有表現タグ,および,係り関係の付与された情報を得ることができる. 固有表現については2.3で述べる. 例文「理由はもちろんドクターイエローが走るから。」を解析した結果を 図2.1に示す.

図: 係り受け解析結果の例
\begin{figure}\begin{center}
\begin{tabular}{l} \hline
$<$sentence$>$\\
$<$chun...
...chunk$>$\ \\
$<$/sentence$>$\ \\
\hline
\end{tabular}
\end{center}\end{figure}



平成26年3月5日