フレーズテーブルの例 |
0 , (0) (0) 0.000963391 0.0017823 0.0196078 0.0047559 2.718
0 10 (0) (0) 0.0540541 0.350932 0.117647 0.0358275 2.718 0 100 (0) (0) 0.0555556 0.512 0.0588235 0.0405834 2.718 0 20 (0) (0) 0.0114943 0.306818 0.0196078 0.0256817 2.718 1 0 10 (0) (0) (0,1) 0.679245 0.118474 0.257143 0.0346384 2.718 1 0 10th (0) (0) (0,1) 0.5 0.0355998 0.00357143 0.00298755 2.718 1 0 Ten (0) (0) (0,1) 0.375 0.120536 0.0107143 0.00585105 2.718 1 0 ten (0) (0) (0,1) 0.685841 0.18536 0.576208 0.0733759 2.718 … |
左から,日本語フレーズ,英語フレーズ,日英方向のフレーズ内単語対応,英日方向のフレーズ内単語対応,そして,フレーズ対応の
確率値5つである.確率値は,左から,英日方向の翻訳確率,英日方向の単語の翻訳確率の積(IBM翻訳モデル),日英方向の翻訳確率,日英方向の単語の翻訳確率の積(IBM翻訳モデル),そして,フレーズペナルティ(値は常に自然対数の底 = 2.718)である.
フレーズテーブルを生成する際,フレーズ内の単語の数を制限するものとして,max-phrase-length(Maximum Phrase Length)が定義されている.例として,max-phrase-lengthが10の場合,日英方向または英日方向の単語列の長さが11以上のフレーズは生成されない.max-phrase-lengthでフレーズ内の単語を制限することで,翻訳精度を向上する場合がある.