next up previous contents
Next: 統計翻訳の問題点 Up: 統計翻訳 Previous: デコーダ   Contents

句に基づく統計翻訳

句に基づく翻訳モデルとは,確率的に日本語から英語の単語列へ翻訳を行うためのモデルである.統計翻訳において,句に基づく翻訳モデルとして,一般的にはフレーズテーブルが用いられている.フレーズテーブルは以下の手順で作成される.表2.1にフレーズテーブルの例を示す.
手順1
IBM翻訳モデルを用いて,単語の対応を得る
手順2
ヒューリスティックスなルールを用いて句に基づく対応を得る
手順3
手順2で求めた句対応から,フレーズテーブルを作成する

Table 2.1: フレーズテーブルの例
突然 天気 が 36#36 Suddenly , the weather 36#36 0.5 0.00217118 1 3.39949e-05 2.718 36#36
0-0 0-1 2-2 1-3 36#36 2 1 1
突然 天気 が 変わっ た 36#36 Suddenly , the weather changed 36#36 0.5 9.13961e-05 0.5
4.2075e-06 2.718 36#36 0-0 0-1 2-2 1-3 3-4 4-4 36#36 2 2 1

左から順に,日本語フレーズ,英語フレーズ,日英方向の翻訳確率9#9,日英方向の単語の翻訳確率の積,英日方向の翻訳確率37#37,英日方向の単語の翻訳確率の積,フレーズペナルティ,フレーズ内単語対応(日英方向)である.以後,フレーズペナルティは常に一定の値であるため省略する.

・Moses
代表的な句に基づく統計翻訳にMoses[9]がある.2.1.3.2節のGIZA++によってIBM翻訳モデルを計算し,言語モデルにはSRILM[2]を用いる.Mosesはオープンソースの句に基づく統計翻訳である.



Hiroto Yasuba 2019-05-08