next up previous contents
次へ: 取立て助詞「は」に関して 上へ: 機械翻訳のための日本語格助詞の予測 戻る: 機械翻訳のための日本語格助詞の予測   目次

概要

鈴木ら[1],[2]は機械翻訳の精度向上のために, 文構造と内容語から格助詞の推定を行っている. 推定は格助詞同定と分類の二段階で行っており, 格助詞同定では,各文節を格助詞が存在するかしないかの2分類を行う. 分類では,文節に格助詞が存在するもののうち「が,を,の,に,から,と,で,へ,まで,より」に 「は,には,からは,とは,では,へは,までは,よりは」を加えた18分類 を行う.推定手法には,最大エントロピー法を利用している. 正解率は,格助詞同定のクローズドテストにおいて0.984,オープンテストにおいて0.960であった. また,分類のクローズドテストにおいて0.886,オープンテストにおいて0.724の正解率であった. 鈴木ら[1],[2]と本研究との差異は,機械学習の手法の違いと,機械学習の分類数が違うことが挙げられる.本研究では,素性が増加することが予測されたので,過学習に強いSVMを利用した. また,分類数を18分類から2分類(「は・が」「に・へ」「に・を」「に・で」の2分類ごと)に減らすことによって, より細かな使い分けの分析を行った.

平成25年2月12日