次へ: 謝辞
上へ: 2013_4
戻る: 使い分けが必要でない文の扱い
目次
日本語学習者の支援のために,
本研究では,機械学習を利用した助詞の推定を行った.
実験を行う前に,助詞の使い分けが必要か否かを,対象の助詞に対して調査した.
結果から,使い分けが必要な助詞は9〜10割程度であり,本研究の必要性が確認できた.
実験の結果,「は・が」の分類におけるSVMの正解率は0.760,「が」の推定はF値0.768(再現率:0.765,適合率:0.772),「は」の推定はF値0.751(再現率:0.755,適合率:0.748)であった.
また,「に・で」「に・を」の分類において,SVMの手法が比較手法の中で最も高い値となった.また,「に・へ」においては全て「に」でない以外の手法がほぼ同等の正解率であった.
実験データにおいて素性の分析(素性の取捨に基づく分析,素性の頻度分析)を行い,
「が・は」の使い分けに役立つ表現を獲得した.
副助詞「は」になりやすい表現として,
述部に存在する助詞「だ」があった.
また,「に・へ・で・を」の使い分けに役立つ表現を多数獲得した.
これらの知見は,今後の助詞に関わる
研究に役立つと思われる.
また,推定結果の誤り解析を行い,誤った原因を調査した.
結果から,「に・へ」「に・で」において素性が不足している可能性があることがわかった.
素性を拡充することで,さらなる正解率の向上が期待される.
平成25年2月12日