next up previous contents
Next: 考察 Up: 動詞の多義語での実験結果 Previous: 動詞の多義語での実験結果   目次

動詞の実験に使用したデータ

「考える」「認める」「やる」「持つ」「見る」という多義語で実験を行った.機械学習手法として最大エントロピー法を用いた. 表5.23から表5.25に「考える」「認める」「やる」「持つ」「見る」についての「SemEval2のテストデータ数」「SemEval2の学習データ数」「言い換えによって増えた文数」を示す.「見る」には辞典に基づく語義が5つある.「認める」「やる」「持つ」には,辞典に基づく語義が4つある.「考える」には,辞典に基づく語義が2つある.


表 5.23: semeval2の学習データ(動詞)


42#42



表 5.24: semeval2のテストデータ(動詞)


42#42



表 5.25: 言い換えによって増えたデータ数(動詞)


43#43


5.23から表5.25のデータを用いた実験の結果を表5.26に示す.


表 5.26: 利用する学習データとその正解率(動詞)


44#44


「考える」は「手法1:SemEval2の学習データのみを利用する手法」と「手法2:SemEval2の学習データ+言い換えによって増えた学習データを利用する手法」と「手法4:再頻出語義を常に出力する手法」が一番良い正解率となった.「認める」は「手法1:SemEval2の学習データのみを利用する手法」と「手法2:SemEval2の学習データ+言い換えによって増えた学習データを利用する手法」が一番良い正解率となった.「やる」と「持つ」は「手法1:SemEval2の学習データのみを利用する手法」が一番良い正解率となった.「見る」は 「手法1:SemEval2の学習データのみを利用する手法」と「手法4: 最頻出語義を常に出力する手法」が一番良い正解率となった.

5.26の結果をまとめたものを表5.27に示す.



表 5.27: 手法と正解率:5単語全て


45#45


5.27より,「手法1:SemEval2の学習データのみを利用する手法」の正解率が0.876に対して,「手法2:SemEval2の学習データ+言い換えによって増えた学習データを利用する手法」の正解率が0.788となっており,正解率が低下した.また,「手法1:SemEval2の学習データのみを利用する手法」が最も良い正解率となった.



Yuma Toda 2018-02-27