ベースラインのフレーズ数,確率値が付与できた翻訳対の数, 最終的に作成されたフレーズ数を表8に示す.
プログラム作成によるフレーズ数 | 確率のついた翻訳対 | 追加後のフレーズ数 | |
(ベースライン) | (手作業) | (提案方法) | |
(grow-diag-final) | |||
単文 | 572,307 | 120,792 | 693,099 |
重複文 | 727,848 | 130,892 | 858,740 |
手作業で作成された翻訳対は,261,453対であった.しかし約半数以上に対して 確率値を付与できなくて,削除されていることがわかる.また,提案法におけ るフレーズテーブルのフレーズ数は,ベースラインと比較すると約2割増加して いる.
コート の すそ the edge of my coat |
0.5 0.00190997 0.25 6.48554e-06 |
朝晩 の ラッシュ 時 に 電車 に 乗る |
take the train during the morning and evening rush hours |
0.1 6.68278e-20 0.125 1.83956e-24 |
国産 の コート は 英国 製 より だいぶ 落ちる |
home-made coats are by far inferior to those made in britain |
0.05 8.90443e-29 0.0454545 5.07768e-33 |