next up previous contents
次へ: 今後の課題1:翻訳確率値の信頼性の調査 上へ: 考察 戻る: 最適化したパラメータを用いた翻訳実験の結果   目次

パラメータintersectionの信頼性

総当たりの対応を取るパラメータintersectionで作成したフレーズテーブルを 用いた時と他のパラメータを用いた時の翻訳精度の比較を行う.

単文の翻訳実験には単文の学習データ(10万文)で作成したフレーズテーブルを使用し, 重文複文の翻訳には重文複文の学習データ(121,913文)で作成したフレーズテー ブルを使用する. テスト文数は単文,重文複文ともに1,000文である. 各パラメータごとの作成フレーズ数と翻訳精度の評価値を表7.7に示す.

=0.1cm
表 7.7: 各パラメータの比較
  単文の翻訳 重文複文の翻訳
パラメータ フレーズ数 BLEU値 METEOR フレーズ数 BLEU値 METEOR
grow-diag-final 572,130 0.125 0.389 727,849 0.077 0.296
intersection 25,684,004 0.106 0.320 62,510,770 0.054 0.225
union 454,417 0.121 0.383 534,621 0.068 0.288
grow 13,500,834 0.108 0.324 30,300,382 0.064 0.256
grow-final 540,262 0.124 0.387 674,676 0.073 0.294
grow-final-and 3,068,048 0.111 0.331 6,377,602 0.067 0.251
grow-diag 7,399,946 0.115 0.337 15,769,297 0.065 0.258
grow-diag-final-and 2,297,996 0.116 0.341 4,900,476 0.058 0.245
intersection-final 25,505,056 0.104 0.318 57,133,882 0.066 0.250
intersection-final-and 25,505,056 0.104 0.318 57,133,882 0.066 0.250

パラメータintersectionで作成したフレーズテーブルのフレーズ数が圧倒的に多 いことが分かる. また,いずれの翻訳においても,パラメータintersectionを用いた時の翻訳精度 は他のパラメータを用いた時と比較して低いことが分かる. このことからパラメータintersectionで作成したフレーズテーブルは,フレーズ のカバー率は圧倒的に高いが翻訳確率の信頼性は低いことが分かる.


next up previous contents
次へ: 今後の課題1:翻訳確率値の信頼性の調査 上へ: 考察 戻る: 最適化したパラメータを用いた翻訳実験の結果   目次
平成21年3月17日