Next: 単語の選定(動詞)
Up: 実験
Previous: 単語の選定(名詞)
目次
戸田ら[1]の研究により,言い換えによって増えたデータを追加することで正解率が向上した.しかし,戸田らは名詞でしか実験を行っていない.そこで本研究では,動詞で実験を行った.言い換えによって増えたデータを追加することで正解率が向上するかを確認する.
機械学習の入力は,多義語を含む文であり,出力は,複数ある語義のうち,どの意味で使われたかとする.
本研究では,SemEval2の対象単語50個のうち動詞「考える」「認める」「やる」の計3個を実験に使用する多義語とする.多義語1語につき,学習データとテストデータはそれぞれ50個ずつである.
また,本研究では言い換えによって増えたデータ数を,SemEval2の学習データの比率になおし実験を行う.
本研究では,毎日新聞1991年から1995年の5年分の新聞データを使用する.
機械学習は最大エントロピー法を使用する.また,表4.1の素性(解析に用いる情報)を利用した.
Yuma Toda
2018-02-27