次へ: 人手による評価
上へ: 自動評価
戻る: 実験条件1における評価結果
目次
実験条件2における評価結果
表7.3に10,000文での評価結果を示す.また表7.4に,表
6.3における適合した文数2,103文での評価結果を示す.
表 7.3:
10,000文の結果
|
BLEU
|
NIST
|
ベースライン |
0.107
|
4.157
|
提案手法 |
0.103
|
4.062
|
表 7.4:
2,103文の結果
|
BLEU
|
NIST
|
ベースライン |
0.206
|
5.133
|
提案手法 |
0.171
|
4.499
|
表7.3において,ベースラインと比較して提案手法ではBLEU値が0.4%低下して
いることから,提案手法が有効でないことがわかる.また表7.4において,
ベースラインと比べて提案手法では3.5%低下していることから,適合した文で
の翻訳精度の低下が表7.3の結果に影響し,提案手法での翻訳精度が低
下した.
平成22年2月11日