そこで,本研究は,様々な手法がある中,単語ごとに適した手法を自動的に選択するために10分割クロスバリデーションを用いる.10分割クロスバリデーションを用いることで,単語ごとに適した方法を使用できていなかったという問題が解決できる.そして,10分割クロスバリデーションを用いて正解率の向上を試みる.
また,別の実験としてSemEval2[2]の学習データ数を言い換えによって増えたデータ数の X 倍 (ここでは 1/10,1/5,1/2,1,2,5,10) のデータ数に変更することにより,性能の変化を調査する. SemEval2[2]は,多義性解消のコンテストで用意されたものであり,多義性解消の研究や実験を行いやすいように人手で作成されたものである.また,その対象の多義語は50個あり,多義語1語につき,学習データとテストデータがそれぞれ50個ずつ用意されている.
また,もう一つ別の実験として先行研究[1]で扱っていなかった動詞と形容詞の実験を行い,言い換えによって増えたデータを追加後,正解率の変化を調査する.
本研究の主な主張点を以下に整理する.
本論文の構成は以下の通りである. 第2章では,先行研究について述べる. 第3章では,本研究の手法について述べる. 第4章では,本研究の実験について述べる. 第5章では,本研究の実験結果について述べる. 第6章では,今後の課題について述べる. 第7章では,本研究の簡単なまとめを述べる.