next up previous contents
次へ: 謝辞 上へ: master 戻る: 翻訳システムのカバー率と翻訳精度の関係   目次

おわりに

本研究では,日英統計翻訳において,短いフレーズ対を用いるために並び替え の候補数が増加し,翻訳精度が低下すると考え,長いフレーズ対を増やす手法を提 案した.具体的には,学習データの日本語文を文節区切りとし,長いフレーズを多く持つ 文節区切りフレーズテーブルを生成した.そして,従来の単語区切りフレーズテー ブルと併用し,翻訳実験を行った.

実験の結果,従来手法と比較して,BLEUスコアが単文で0.43%,重文複文で0.38%向上した. また,同等の手法を学習データの英語文に対して適用した場合の実験も行った. 英語文に適用した場合も,従来手法と比較して,翻訳精度が向上した.さらに, 従来手法のフレーズテーブルと提案手法により得られた3つのフレーズテーブル を併用した実験も行った.4つのフレーズテーブルを用いた場合,従来手法と比 較して,BLEUスコアが単文の翻訳で0.71%,重文複文の翻訳で0.51%向上した. 翻訳精度が向上した理由として,長いフレーズ対が,並び替えの候補を減らす効 果を持つことに加え,助詞や接尾辞といった日本語と英語の文法構造の違いを補 う効果を持つということを考えている.

今後の予定として,文節とフレーズ以外の区切りを用いて,併用するフレーズテー ブルを増やすことを考えている.



平成22年2月17日