単文の翻訳実験には単文の学習データ(10万文)で作成したフレーズテーブルを使用し,
重文複文の翻訳には重文複文の学習データ(121,913文)で作成したフレーズテー
ブルを使用する.
テスト文数は単文,重文複文ともに1,000文である.
各パラメータごとの作成フレーズ数と翻訳精度の評価値を表7.7に示す.
単文の翻訳 | 重文複文の翻訳 | |||||
パラメータ | フレーズ数 | BLEU値 | METEOR | フレーズ数 | BLEU値 | METEOR |
grow-diag-final | 572,130 | 0.125 | 0.389 | 727,849 | 0.077 | 0.296 |
intersection | 25,684,004 | 0.106 | 0.320 | 62,510,770 | 0.054 | 0.225 |
union | 454,417 | 0.121 | 0.383 | 534,621 | 0.068 | 0.288 |
grow | 13,500,834 | 0.108 | 0.324 | 30,300,382 | 0.064 | 0.256 |
grow-final | 540,262 | 0.124 | 0.387 | 674,676 | 0.073 | 0.294 |
grow-final-and | 3,068,048 | 0.111 | 0.331 | 6,377,602 | 0.067 | 0.251 |
grow-diag | 7,399,946 | 0.115 | 0.337 | 15,769,297 | 0.065 | 0.258 |
grow-diag-final-and | 2,297,996 | 0.116 | 0.341 | 4,900,476 | 0.058 | 0.245 |
intersection-final | 25,505,056 | 0.104 | 0.318 | 57,133,882 | 0.066 | 0.250 |
intersection-final-and | 25,505,056 | 0.104 | 0.318 | 57,133,882 | 0.066 | 0.250 |
パラメータintersectionで作成したフレーズテーブルのフレーズ数が圧倒的に多 いことが分かる. また,いずれの翻訳においても,パラメータintersectionを用いた時の翻訳精度 は他のパラメータを用いた時と比較して低いことが分かる. このことからパラメータintersectionで作成したフレーズテーブルは,フレーズ のカバー率は圧倒的に高いが翻訳確率の信頼性は低いことが分かる.