次へ: 取立て助詞「は」に関して
上へ: 機械翻訳のための日本語格助詞の予測
戻る: 機械翻訳のための日本語格助詞の予測
目次
鈴木ら[1],[2]は機械翻訳の精度向上のために,
文構造と内容語から格助詞の推定を行っている.
推定は格助詞同定と分類の二段階で行っており,
格助詞同定では,各文節を格助詞が存在するかしないかの2分類を行う.
分類では,文節に格助詞が存在するもののうち「が,を,の,に,から,と,で,へ,まで,より」に
「は,には,からは,とは,では,へは,までは,よりは」を加えた18分類
を行う.推定手法には,最大エントロピー法を利用している.
正解率は,格助詞同定のクローズドテストにおいて0.984,オープンテストにおいて0.960であった.
また,分類のクローズドテストにおいて0.886,オープンテストにおいて0.724の正解率であった.
鈴木ら[1],[2]と本研究との差異は,機械学習の手法の違いと,機械学習の分類数が違うことが挙げられる.本研究では,素性が増加することが予測されたので,過学習に強いSVMを利用した.
また,分類数を18分類から2分類(「は・が」「に・へ」「に・を」「に・で」の2分類ごと)に減らすことによって,
より細かな使い分けの分析を行った.
平成25年2月12日