単文 | ||
BLEU | 未知語を含む文の数 | |
日:単語,英:単語(従来) | 0.2015 | 2,189 |
従来+日:文節,英:単語 | 0.2058 | 2,072 |
従来+日:単語,英:フレーズ | 0.2063 | 2,030 |
従来+日:文節,英:フレーズ | 0.2045 | 2,145 |
4つを併用 | 0.2086 | 1,926 |
重文複文 | ||
BLEU | 未知語を含む文数 | |
日:単語,英:単語(従来) | 0.1746 | 2,649 |
従来+日:文節,英:単語 | 0.1784 | 2,514 |
従来+日:単語,英:フレーズ | 0.1760 | 2,457 |
従来+日:文節,英:フレーズ | 0.1783 | 2,595 |
4つを併用 | 0.1797 | 2,339 |
表から,単文の翻訳において,未知語を含む文の数が少ないほど, BLEUスコアは向上している.しかし,重文複文の翻訳において,「日本語文を単語区切り, 英語文をフレーズ区切りとした」学習データから生成されたフレーズテーブルを併 用した場合,未知語は大きく減少しているが翻訳精度の向上は小さかった.この ことから,重文複文の翻訳精度の向上のために,未知語を減らすことより,長いフレー ズ対を増やすことが有効であると考えている.