next up previous contents
次へ: IBM翻訳モデル 上へ: 日英統計翻訳システム 戻る: 概要   目次

翻訳モデル

翻訳モデルは,日本語から英語の単語列へ,確率的に翻訳を行うためのモデルである. 統計翻訳において,句に基づく翻訳モデルとして,一般的に,フレーズテーブルが用いられている. フレーズテーブルは以下の手順によって作成される.
手順1
後述するIBMモデルを用いて,単語の対応を得る
手順2
ヒューリスティックスなルールを用いて句に基づく対応を得る
手順3
手順2で求めた句対応から,フレーズテーブルを作成する
詳しい作成手順については,後述する.また,表2.1にフレーズテーブルの例を示す.

表: フレーズテーブルの例
日フレーズ 英フレーズ $ P(j\vert e)$ $ \prod P(j\vert e)$ $ P(e\vert j)$ $ \prod P(e\vert j)$
季節 the season 0.3 3.6 0.1 1.8
新緑 の 季節 the season of green leaves 0.3 3.6 0.1 2.6
雨 の 後 after the rain 0.3 1.2 0.1 1.8

左から順に,日本語フレーズ,英語フレーズ,日英方向の翻訳確率$ P(j\vert e)$ ,日英方向の単語の翻訳確率の積,英日方向の翻訳確率$ P(e\vert j)$ ,英日方向の単語の翻訳確率の積である.



Subsections

平成25年2月12日