next up previous contents
Next: 正解例と誤り例 Up: 名詞の多義語での実験結果 Previous: 有意差検定   目次

考察(クロスバリデーションによる手法選択)

「手法1:SemEval2の学習データのみを利用する手法」の正解率0.733に対して,「手法2:SemEval2の学習データ+言い換えによって増えた学習データを利用する手法」の正解率0.738と,正解率がほとんど変わらなかった理由としては,言い換えによって増えたデータが必ずしも良いデータとは限らないということが考えられる.つまり,言い換えによって増えたデータが悪さをしていることがあるということである.このことから言い換えを利用したほうが良い多義語とそうでない多義語があることがわかる.

また,本研究は6個の単語で12回実験を行うことができる. SemEval2の学習データでの10分割クロスバリデーションにより正しく手法選択できた実験は,12回の実験のうち10回の実験であった.これは,学習データとテストデータで同じ手法の性能が良いという相関があることを示している.


Yuma Toda 2018-02-27