next up previous contents
次へ: 謝辞 上へ: graduation 戻る: 追加実験   目次


おわりに

本研究では,単文を用いて,自動評価と人手評価を行い,結果を比較した. 結果として,ルールベース翻訳とハイブリッド翻訳の比較において, すべての自動評価と人手評価の結果に差異があることを確認した. したがって,今回用いた7種類の自動評価法に問題があると考えている.

しかしMETEOR,IMPACT,RIBESについては,ルールベース翻訳と句に基づく統計翻訳の比較, さらにルールベース翻訳と階層句に基づく統計翻訳の比較において,自動評価と人手評価の結果が同じに なった.よってMETEOR,IMPACT,RIBESは他の自動評価法より信頼性があると考えている.

また折り返し翻訳を利用した評価では,英日翻訳にルールベース翻訳を用いた場合に 人手評価と同じ結果となった. しかしながら,折り返し成功率が1〜3%前後であり,信頼性は低いと考えている. よって,折り返し翻訳を利用した評価法は,今後改良の余地がある.

したがって今後は,さらに様々な自動評価法を検討し, 人手評価と同様の結果が得られる評価法を調査していきたい.



平成24年3月13日