GIZA++

次へ: 言語モデル 上へ: 翻訳モデル 戻る: Model5 目次

GIZA++は，統計翻訳で用いることを前提にして，OchとNeyによって作成されたツールである．これは，IBM Model1～5を用いて翻訳する言語と目的言語における単語の対応関係(Word Alignment)の確率値を計算する．GIZA++を用いた場合，以下のファイルが出力される．

T TABLE (Translation Table)
T TABLEは，Model1からModel3により作成された翻訳確率 $P(f\vert e)$ のデータである．は翻訳する言語で，は目的言語である．T TABLEは各行が，目的言語の単語ID()，翻訳する言語の単語ID()，翻訳する言語の単語から目的言語の単語へ翻訳する確率( $P(f_id\vert e_id)$ )で構成される．
N TABLE (Fertility Table)
N TABLEは，目的言語の単語における繁殖数を表したデータである．N TABLEは各行が，目的言語の単語ID()，繁殖数が0である確率()，繁殖数が1である確率()，…，繁殖数が $n$ である確率()で構成される．

平成28年3月16日