next up previous contents
次へ: おわりに 上へ: 考察 戻る: 単文と重文複文の翻訳精度の傾向の違い   目次

翻訳システムのカバー率と翻訳精度の関係

本研究では,4つの翻訳実験を行った.各翻訳結果に含まれる未知語の数を表 [*]に示す.


表: 各翻訳結果の未知語数(テストデータ:各9,000文)
単文
  BLEU 未知語を含む文の数
日:単語,英:単語(従来) 0.2015 2,189
従来+日:文節,英:単語 0.2058 2,072
従来+日:単語,英:フレーズ 0.2063 2,030
従来+日:文節,英:フレーズ 0.2045 2,145
4つを併用 0.2086 1,926
重文複文
  BLEU 未知語を含む文数
日:単語,英:単語(従来) 0.1746 2,649
従来+日:文節,英:単語 0.1784 2,514
従来+日:単語,英:フレーズ 0.1760 2,457
従来+日:文節,英:フレーズ 0.1783 2,595
4つを併用 0.1797 2,339

[*]から,単文の翻訳において,未知語を含む文の数が少ないほど, BLEUスコアは向上している.しかし,重文複文の翻訳において,「日本語文を単語区切り, 英語文をフレーズ区切りとした」学習データから生成されたフレーズテーブルを併 用した場合,未知語は大きく減少しているが翻訳精度の向上は小さかった.この ことから,重文複文の翻訳精度の向上のために,未知語を減らすことより,長いフレー ズ対を増やすことが有効であると考えている.



平成22年2月17日