次へ: 謝辞 上へ: graduation 戻る: 追加実験目次

おわりに

本研究では，単文を用いて，自動評価と人手評価を行い，結果を比較した．結果として，ルールベース翻訳とハイブリッド翻訳の比較において，すべての自動評価と人手評価の結果に差異があることを確認した．したがって，今回用いた7種類の自動評価法に問題があると考えている．

しかしMETEOR，IMPACT，RIBESについては，ルールベース翻訳と句に基づく統計翻訳の比較，さらにルールベース翻訳と階層句に基づく統計翻訳の比較において，自動評価と人手評価の結果が同じになった．よってMETEOR，IMPACT，RIBESは他の自動評価法より信頼性があると考えている．

また折り返し翻訳を利用した評価では，英日翻訳にルールベース翻訳を用いた場合に人手評価と同じ結果となった．しかしながら，折り返し成功率が1～3%前後であり，信頼性は低いと考えている. よって，折り返し翻訳を利用した評価法は，今後改良の余地がある.

したがって今後は，さらに様々な自動評価法を検討し，人手評価と同様の結果が得られる評価法を調査していきたい．

平成24年3月13日