評価実験

本研究では,NMTの学習データに対訳学習文のみを用いる手法(以下,ベースラ イン)と,対訳学習文に対訳句を追加した学習データを用いる手法(以下,提案 手法)を比較する.
評価方法として,自動評価と人手評価を行う.自動評価では実験で得られた 16328文の出力文に対して,4つの自動評価指標 (BLEU,METEOR,RIBES,TER) で評価を行う.人手対比較評価では,出力文16328文より無作為に抽出した100 文に対して,正確性に基づいて6人がそれぞれ対比較評価を行い、集計を取った.