next up previous contents
次へ: IMPACT 上へ: 自動評価 戻る: NIST   目次

METEOR

METEORは,単語属性が正しい場合に高いスコアを出す.実験ではuni-gramを用いる. METEORは0から1までのスコアを出力し,スコアの大きい方が評価が良い評価である.計算式を以下に示す.
46#46 9#9 47#47 (3.10)
48#48 9#9 49#49 (3.11)
50#50 9#9 51#51 (3.12)

METEORはF値,ペナルティ関数52#52を用いて計算される. F値は適合率Pと再現率Rの調和平均で求められる. そしてペナルティ関数52#52において,mは参照文と出力文の間で一致した単語数を示す. また53#53は,一致した単語を対象として,参照文と一致する単語列を1つのまとまりに 統合した際のまとまりの数を示す. したがって,参照文と出力文が同一文である場合は53#53=1となる. なお54#54,55#55,56#56の値はパラメータである. 具体的な計算例を以下に示す.
[
c]例 日本語文:お先 に 失礼 し ます 。
参照文:Excuse me , I must be going now .
出力文:Excuse me , but I mest be going now .

計算方法
参照文Bと出力文A,AとBの重複部分Cとする.またパラメータ 57#57とする.

58#58 9#9 59#59 (3.13)
60#60 9#9 61#61 (3.14)
46#46 9#9 62#62 (3.15)
63#63 9#9 64#64 (3.16)
65#65 9#9 66#66 (3.17)
  9#9 67#67 (3.18)
  9#9 68#68 (3.19)


next up previous contents
次へ: IMPACT 上へ: 自動評価 戻る: NIST   目次
平成24年3月13日