しかしMETEOR,IMPACT,RIBESについては,ルールベース翻訳と句に基づく統計翻訳の比較, さらにルールベース翻訳と階層句に基づく統計翻訳の比較において,自動評価と人手評価の結果が同じに なった.よってMETEOR,IMPACT,RIBESは他の自動評価法より信頼性があると考えている.
また折り返し翻訳を利用した評価では,英日翻訳にルールベース翻訳を用いた場合に 人手評価と同じ結果となった. しかしながら,折り返し成功率が1〜3%前後であり,信頼性は低いと考えている. よって,折り返し翻訳を利用した評価法は,今後改良の余地がある.
したがって今後は,さらに様々な自動評価法を検討し, 人手評価と同様の結果が得られる評価法を調査していきたい.