NISTは,BLEUと同様にN-gram適合率で評価を行う.情報量で重み付けをしている点が異なる. また,本実験では5-gramを用いる.NISTは,0から∞のスコアを出力し,スコアが大きいほど良い評価となる. NIST計算式を式3.4に示す.