next up previous contents
Next: フレーズテーブル作成法 Up: 日英統計翻訳システム Previous: GIZA++   目次

句に基づく翻訳モデル

句に基づく翻訳モデルとは,確率的に日本語から英語の単語列へ翻訳を行うためのモデルである.統計翻訳において,句に基づく翻訳モデルとして,一般的にはフレーズテーブルが用いられている.フレーズテーブルは以下の手順で作成される.
手順1
IBMモデルを用いて,単語の対応を得る
手順2
ヒューリスティックスなルールを用いて句に基づく対応を得る
手順3
手順2で求めた句対応から,フレーズテーブルを作成する
詳しい作成手順については,[*]節にて説明する.また,表[*]にフレーズテーブルの例を示す.

表: フレーズテーブルの例
突然 天気 が $\vert\vert\vert$ Suddenly , the weather $\vert\vert\vert$ 0.5 0.00217118 1 3.39949e-05 2.718 $\vert\vert\vert$
0-0 0-1 2-2 1-3 $\vert\vert\vert$ 2 1 1
突然 天気 が 変わっ た $\vert\vert\vert$ Suddenly , the weather changed $\vert\vert\vert$ 0.5 9.13961e-05 0.5
4.2075e-06 2.718 $\vert\vert\vert$ 0-0 0-1 2-2 1-3 3-4 4-4 $\vert\vert\vert$ 2 2 1
突然 天気 が 変わっ た 。 $\vert\vert\vert$ Suddenly , the weather changed . $\vert\vert\vert$ 0.5 9.13961e-05
0.5 4.20734e-06 2.718 $\vert\vert\vert$ 0-0 0-1 2-2 1-3 3-4 4-4 5-5 $\vert\vert\vert$ 2 2 1

左から順に,日本語フレーズ,英語フレーズ,日英方向の翻訳確率$P(j\vert e)$,日英方向の単語の翻訳確率の積,英日方向の翻訳確率$P(e\vert j)$,英日方向の単語の翻訳確率の積,フレーズペナルティ,フレーズ内単語対応(日英方向)である.以後,フレーズペナルティは常に一定の値であるため省略する.



s122019 2016-03-03