次へ: 目次
上へ: honron_v2
戻る: honron_v2
目次
近年の機械翻訳では,対訳データから自動的に翻訳規則を生成し翻訳を行う統計翻訳が注目されている.統計翻訳において,主語を省略している日本語文の翻訳精度が低いことは,問題点の1つである.この問題に対し,様々な研究が行われている.
日本語文において省略されている格要素の補完を行う研究として,中岩らの研究がある.中岩らは,省略補完のために,格の意味的制約・用言意味属性・様相表現・接続語などを考慮したルールを構築した.そして,構築したルールを用いて省略格要素の指示対象を推定した.実験の結果,ほとんどの省略格要素の適切な補完を報告した.
また,省略補完を統計翻訳へ適用した研究としては,古市らの研究や,平らの研究がある.古市らは,日英統計翻訳において,主語を省略している日本語文に対し,主語として``私は"を自動で補完した.実験の結果,テストデータのみ主語を補完した場合,人手評価と自動評価において翻訳精度の向上を報告した.また平らは,日英統計翻訳において,日本語文の省略格要素を人手で補完し,翻訳を行った.実験の結果,人手評価と自動評価において翻訳精度の向上を報告した.
しかし,古市らの調査では次のような事例を示した.1)ある特定の主語(例えば``私は")において日本語文の翻訳品質は低いが,他の主語(例えば``彼は")において翻訳品質が高い.2)主語がある日本語文の翻訳品質は低いが,主語を省略している日本語文の翻訳品質は高い.
そこで本研究では,主語を省略している日本語文及び,8種類の主語を補完した文をそれぞれ翻訳し,翻訳品質が高い文を選出することで,翻訳精度の向上を目指す.まず,8種類の主語を補完した日本語文と,主語を省略している日本語文に対し,それぞれ日英統計翻訳を行い,複数の出力文を得る.次に,翻訳モデルの確率と言語モデルの確率を掛け合わせた翻訳確率が最大となる出力文を選出する.そして,選出した文を,最終的な出力文とする.
実験の結果,人手評価と自動評価において翻訳精度の向上を示し,提案手法の有効性を確認できた.
平成25年2月13日