単文 | 重文複文 | |||||
BLEU | NIST | METEOR | BLEU | NIST | METEOR | |
ベースライン | 0.1091 | 3.982 | 0.4597 | 0.0916 | 3.627 | 0.2645 |
提案手法(鳥バンク) | 0.1068 | 3.839 | 0.4566 | 0.0894 | 3.382 | 0.2526 |
対訳フレーズデータ実験(鳥バンク) | 0.1015 | 3.777 | 0.4453 | 0.0761 | 3.251 | 0.2298 |
提案手法(英辞郎) | 0.1114 | 3.989 | 0.4625 | 0.0944 | 3.626 | 0.2667 |
対訳フレーズデータ実験(英辞郎) | 0.1059 | 3.943 | 0.4558 | 0.0851 | 3.518 | 0.2557 |
単文 | 重文複文 | |||
BLEU | NIST | BLEU | NIST | |
ベースライン | 0.1519 | 4.114 | 0.1132 | 3.487 |
提案手法(鳥バンク) | 0.1522 | 4.088 | 0.1102 | 3.354 |
対訳フレーズデータ実験(鳥バンク) | 0.1441 | 3.941 | 0.0944 | 3.072 |
提案手法(英辞郎) | 0.1527 | 4.109 | 0.1157 | 3.511 |
対訳フレーズデータ実験(英辞郎) | 0.1469 | 4.034 | 0.1059 | 3.372 |
結果から,対訳フレーズデータ実験の自動評価結果はベースラインより劣っているという結果になった. この原因は,対訳フレーズデータのみでは学習データ不足であるため,評価値がベースラインより下がったためであると考えられる.