(2.15) | |||
(2.16) | |||
(2.17) |
METEORはまず再現率と適合率に基づくF値を求め,次に,単語の非連続性に対するペナルティとして関数を与える. ペナルティ関数において,は出力文と正解文の単語の一致率を表す. そして,は一致した単語を対象に,正解文と語順が同じものを1つのまとまりとして統合した場合の,まとまりの数を表す. そのため,出力文と正解文が同じ文であるとき=1となる. また,一致率の計算において,WordNetによる類義語を用いて,似た意味を持つ単語は同一であると判断される. ,,の値はパラメータである. 本研究では,=0.9,=3.0,=0.5の値を用いる.
BLEUとMETEORでは0から1までの間で評価され,NISTでは0から∞までの間で評価される. いずれの評価方法でも,評価方法が高いほど翻訳精度が高いことを表す. 尚,本研究では入力文1文に対して正解文1文を用いて評価を行う.