next up previous contents
次へ: METEOR 上へ: 自動評価 戻る: BLEU   目次

NIST

NISTは,BLEUと同様にN-gram適合率で評価を行う.情報量で重み付けしている点が異なる. また,実験では5-gramを用いる.NISTは0から∞のスコアを出力し,スコアが大きい方が良い評価である. NISTの計算式を以下に示す.
44#44     (3.8)
45#45     (3.9)



平成24年3月13日