next up previous contents
次へ: NIST 上へ: 自動評価 戻る: BLEU   目次

METEOR

METEORは,正解文と比較し,3人称単数や時制などの単語属性が正しい場合に高いスコアを出力し,0から1までの値で評価を行う.METEORは以下の式で計算される.


$\displaystyle METEOR_{score}$ $\displaystyle =$ $\displaystyle F_{mean} \times (1-Pen)$ (29)
$\displaystyle F_{mean}$ $\displaystyle =$ $\displaystyle \frac{P \times R}{\alpha \times P + (1-\alpha) \times R}$ (30)
$\displaystyle Pen$ $\displaystyle =$ $\displaystyle \gamma \times (\frac{c}{m})^\beta$ (31)

METEORはF値(再現率$ R$ と適合率$ P$ の調和平均)と,単語の非連続性に対するペナルティ関数$ Pen$ を用い計算される.ペナルティ関数$ Pen$ において,$ m$ は出力文と正解文の単語の一致率を表す.そして,$ c$ は一致した単語を対象に,正解文と語順が同じものを1つのまとまりとして統合した場合の,まとまりの数を表す.そのため,出力文と正解文が同じ文であるとき$ c$ =1となる.また,一致率の計算において,WordNetによる類義語を用いて,似た意味を持つ単語は同一であると判断される.$ \alpha$$ \beta$$ \gamma$ の値はパラメータである.



平成23年4月12日