next up previous contents
Next: GIZA++ Up: 日英統計翻訳 Previous: IBM翻訳モデル   目次

句に基づく翻訳モデル

句に基づく翻訳モデルとは,確率的に日本語から英語の単語列へ翻訳を行うためのモデルである.統計翻訳において,句に基づく翻訳モデルとして,一般的にはフレーズテーブルが用いられている.フレーズテーブルは以下の手順で作成される.表2.1にフレーズテーブルの例を示す.
手順1
IBM翻訳モデルを用いて,単語の対応を得る
手順2
ヒューリスティックスなルールを用いて句に基づく対応を得る
手順3
手順2で求めた句対応から,フレーズテーブルを作成する

表 2.1: フレーズテーブルの例
突然 天気 が $\vert\vert\vert$ Suddenly , the weather $\vert\vert\vert$ 0.5 0.00217118 1 3.39949e-05 2.718 $\vert\vert\vert$
0-0 0-1 2-2 1-3 $\vert\vert\vert$ 2 1 1
突然 天気 が 変わっ た $\vert\vert\vert$ Suddenly , the weather changed $\vert\vert\vert$ 0.5 9.13961e-05 0.5
4.2075e-06 2.718 $\vert\vert\vert$ 0-0 0-1 2-2 1-3 3-4 4-4 $\vert\vert\vert$ 2 2 1

左から順に,日本語フレーズ,英語フレーズ,日英方向の翻訳確率$P(j\vert e)$,日英方向の単語の翻訳確率の積,英日方向の翻訳確率$P(e\vert j)$,英日方向の単語の翻訳確率の積,フレーズペナルティ,フレーズ内単語対応(日英方向)である.以後,フレーズペナルティは常に一定の値であるため省略する.



s122019 2018-02-15