次へ: 言語モデル
上へ: 翻訳モデル
戻る: Model5
目次
GIZA++は,統計翻訳で用いることを前提にして,OchとNeyによって作成されたツールである.これは,IBM Model1〜5を用いて翻訳する言語と目的言語における単語の対応関係(Word Alignment)の確率値を計算する.GIZA++を用いた場合,以下のファイルが出力される.
- T TABLE (Translation Table)
T TABLEは,Model1からModel3により作成された翻訳確率のデータである.は翻訳する言語で,は目的言語である.T TABLEは各行が,目的言語の単語ID(),翻訳する言語の単語ID(),翻訳する言語の単語から目的言語の単語へ翻訳する確率()で構成される.
- N TABLE (Fertility Table)
N TABLEは,目的言語の単語における繁殖数を表したデータである.N TABLEは各行が,目的言語の単語ID(),繁殖数が0である確率(),繁殖数が1である確率(),…,繁殖数がである確率()で構成される.
平成28年3月16日