next up previous contents
Next: 単語クラスタリングに基づく情報抽出 Up: 提案手法 Previous: 提案手法   目次

表生成における情報抽出

Akanoら [2]の研究では,Wikipediaから抽出した事柄を含むページのデータのみで単語クラスタリングを行っていた.しかし,Wikipediaから抽出した事柄を含むページだけではデータが少なく,クラスタリングの精度が低くなる問題点があった.また,1つのクラスタを重要項目としていたため,単語の網羅性が低いという問題点もあった.

そこで,本研究では2つの問題点を解消するためにword2vecと分類語彙表を用いて重要項目の取り出し技術の改良を行う.以下で,本研究の提案手法である,「単語クラスタリング」と「類似度」と「分類語彙表」の3つの手法を説明する.



Subsections

akano hokuto 2018-03-06