次へ: 重要単語の強調表示
上へ: 読書支援の方法
戻る: 重要単語の定義
目次
形態素解析は自然言語処理の分野において,語を最小単位まで分割する技術である.
本研究では形態素解析機ChaSenを用いている.ChaSenは辞書定義ファイルと文法定義ファイルから
なっており,これらから構成される辞書に含まれていない形態素は「未知語」として出力される.
「未知語」に関しては,世代が進むにつれて新たに用いられるようになった語,また固有名詞などが含まれると
思われる.よって「未知語」も形態素として重要な情報を含んでいるため,本研究では重要単語の定義に含めた.
root
平成23年3月23日