次へ: 固有表現抽出
上へ: 基本技術
戻る: シソーラス
目次
形態素解析は文章を意味のある単語に区切り,辞書を利用して品詞や内容を判別することである.
ソフトとしてはChaSenやMeCabなどがある.
構文解析は,文節間の係り受け構造を発見することである.
ソフトとしてはKNPやCaboCha[7]などがある.
本実験ではCaboChaを用いる.
CaboChaはSVMに基づく日本語係り受け解析器である.
入力文から単語境界,品詞,固有表現タグ,および,係り関係の付与された情報を得ることができる.
固有表現については2.3で述べる.
例文「理由はもちろんドクターイエローが走るから。」を解析した結果を
図2.1に示す.
図:
係り受け解析結果の例
|
平成26年3月5日