次へ:
METEOR
上へ:
自動評価
戻る:
BLEU
目次
NIST
NIST[
3
]は,BLEUと同様に
N
-gram適合率で評価を行う.情報量で重み付けしている点が異なる. また,実験では
5
-gramを用いる.NISTは0から∞のスコアを出力し,スコアが大きい方が良い評価である. NISTの計算式を以下に示す.
(3.8)
(3.9)
平成25年2月12日