next up previous contents
次へ: METEOR 上へ: 自動評価 戻る: BLEU   目次

NIST

NISTではBLEUと同様に語順(5-gram)の正しさで比較を行うが,BLEUとは情報量によって重み付けをしている点が異なる.また,ペナルティ関数が異なっており,NISTの方が文長を考慮するペナルティが課せられる. NISTは以下の式で計算される.
$\displaystyle NIST_{score} = BP \times \sum_{N=1}^N \frac{\displaystyle\sum_i \...
...playstyle\sum_i \mbox{出力文{\it i}と正解文{\it i}で一致した{\it N}-gramの数} }$     (3.4)
$\displaystyle Info_i \left( w_1 ... w_n \right) = \log_2 \frac{評価コーパス中 \...
...w_1 ... w_{n-1} \right)の数}{評価コーパス中の \left( w_1 ... w_n \right) の数 }$     (3.5)

NISTは0から$\infty$の値をスコアとして出力し,スコアの値が高いほど翻訳精度が高いことを示す.


s102025 平成27年3月9日