原因として,自動評価法は単語対応で評価してしまうため, 出力文と正解文の一部の単語が一致していればスコアが高くなるからではないかと考える. この問題の解決策として,評価方法として比較的信頼性の高い人手での対比較評価を行うようにするか,単語対応での自動評価法だけではなく,人手評価法に近い自動評価法を考案することであると考える.