Next: 単語クラスタリングに基づく情報抽出
Up: 提案手法
Previous: 提案手法
目次
Akanoら [2]の研究では,Wikipediaから抽出した事柄を含むページのデータのみで単語クラスタリングを行っていた.しかし,Wikipediaから抽出した事柄を含むページだけではデータが少なく,クラスタリングの精度が低くなる問題点があった.また,1つのクラスタを重要項目としていたため,単語の網羅性が低いという問題点もあった.
そこで,本研究では2つの問題点を解消するためにword2vecと分類語彙表を用いて重要項目の取り出し技術の改良を行う.以下で,本研究の提案手法である,「単語クラスタリング」と「類似度」と「分類語彙表」の3つの手法を説明する.
Subsections
akano hokuto
2018-03-06