次へ: 謝辞
上へ: honron_v2
戻る: 提案手法の選出方法
目次
結論
統計翻訳において,主語を省略している日本語文の翻訳精度が低いことは,問題点の1つである.この問題に対し,古市らは,日英統計翻訳において,主語を省略している日本語文に対し,主語として``私は"を自動で補完した.
しかし,古市らの調査では次のような事例を示した.1)ある特定の主語(例えば``私は")において日本語文の翻訳品質は低いが,他の主語(例えば``彼は")において翻訳品質が高い.2)主語がある日本語文の翻訳品質は低いが,主語を省略している日本語文の翻訳品質は高い.
そこで本研究では,主語を省略している日本語文及び,8種類の主語を補完した文をそれぞれ翻訳し,翻訳品質が高い文を選出することで,翻訳精度の向上を目指した.まず,8種類の主語を補完した日本語文と,主語を省略している日本語文に対し,それぞれ日英統計翻訳を行った.次に,翻訳モデルの確率と言語モデルの確率を掛け合わせた翻訳確率が最大となる出力文を選出した.そして,選出した文を,最終的な出力文とした.
実験の結果,句ベース統計翻訳では,先行手法と比較し,自動評価では,BLEU値において0.0064向上し,提案手法の有効性が確認できた.また,人手評価において25文の翻訳精度が向上し,2文の翻訳精度が低下した.人手評価おいて翻訳精度が向上した25文を分類した結果,複数の主語補完による改善は6文であり,原文の出力による改善は19文であった.よって,提案手法は先行手法の問題点を改善した.一方,翻訳精度が低下した2文は,提案手法の選出の誤りであった.今後,翻訳品質が高い文の,より有効な選出方法を提案することで,翻訳精度の向上を目指す.
平成25年2月13日