next up previous contents
Next: 先行研究 Up: syuron13 Previous: 表目次   目次

はじめに

現在,自然言語処理における重要な問題の一つに,多義性解消がある.多義性解消とは,多義語(複数の語義を持つ語)が文中に出現したときに,その多義語の語義を,1つの語義に絞ることをいう.多義性解消は,翻訳や知識獲得に役立つ.先行研究[1]に言い換えを使った研究がある.言い換えを使うことで,多義性解消の誤りの原因である,学習データの不足を改善することができる.先行研究では,様々な手法を用いているが,単語ごとに適した方法を使用できていなかったという問題がある.

そこで,本研究は,様々な手法がある中,単語ごとに適した手法を自動的に選択するために10分割クロスバリデーションを用いる.10分割クロスバリデーションを用いることで,単語ごとに適した方法を使用できていなかったという問題が解決できる.そして,10分割クロスバリデーションを用いて正解率の向上を試みる.

また,別の実験としてSemEval2[2]の学習データ数を言い換えによって増えたデータ数の X 倍 (ここでは 1/10,1/5,1/2,1,2,5,10) のデータ数に変更することにより,性能の変化を調査する. SemEval2[2]は,多義性解消のコンテストで用意されたものであり,多義性解消の研究や実験を行いやすいように人手で作成されたものである.また,その対象の多義語は50個あり,多義語1語につき,学習データとテストデータがそれぞれ50個ずつ用意されている.

また,もう一つ別の実験として先行研究[1]で扱っていなかった動詞と形容詞の実験を行い,言い換えによって増えたデータを追加後,正解率の変化を調査する.

本研究の主な主張点を以下に整理する.

本論文の構成は以下の通りである. 第2章では,先行研究について述べる. 第3章では,本研究の手法について述べる. 第4章では,本研究の実験について述べる. 第5章では,本研究の実験結果について述べる. 第6章では,今後の課題について述べる. 第7章では,本研究の簡単なまとめを述べる.



Yuma Toda 2018-02-27