句に基づく統計翻訳

Next: 統計翻訳の問題点 Up: 統計翻訳 Previous: デコーダ Contents

句に基づく翻訳モデルとは，確率的に日本語から英語の単語列へ翻訳を行うためのモデルである．統計翻訳において，句に基づく翻訳モデルとして，一般的にはフレーズテーブルが用いられている．フレーズテーブルは以下の手順で作成される．表2.1にフレーズテーブルの例を示す．

**Table 2.1:** フレーズテーブルの例
突然天気が 36#36 Suddenly , the weather 36#36 0.5 0.00217118 1 3.39949e-05 2.718 36#36
0-0 0-1 2-2 1-3 36#36 2 1 1
突然天気が変わった 36#36 Suddenly , the weather changed 36#36 0.5 9.13961e-05 0.5
4.2075e-06 2.718 36#36 0-0 0-1 2-2 1-3 3-4 4-4 36#36 2 2 1

左から順に，日本語フレーズ，英語フレーズ，日英方向の翻訳確率9#9，日英方向の単語の翻訳確率の積，英日方向の翻訳確率37#37，英日方向の単語の翻訳確率の積，フレーズペナルティ，フレーズ内単語対応（日英方向）である．以後，フレーズペナルティは常に一定の値であるため省略する．

代表的な句に基づく統計翻訳にMoses[9]がある.2.1.3.2節のGIZA++によってIBM翻訳モデルを計算し，言語モデルにはSRILM[2]を用いる．Mosesはオープンソースの句に基づく統計翻訳である．

Hiroto Yasuba 2019-05-08