next up previous contents
次へ: IBM翻訳モデル 上へ: 日英統計翻訳システム 戻る: 概要   目次

翻訳モデル

翻訳モデルは,日本語から英語の単語列へ,確率的に翻訳を行うためのモデルである. 統計翻訳において,句に基づく翻訳モデルとして,一般的に,フレーズテーブルが用いられている. フレーズテーブルは以下の手順によって作成される.
手順1
後述するIBMモデルを用いて,単語の対応を得る
手順2
ヒューリスティックスなルールを用いて句に基づく対応を得る
手順3
手順2で求めた句対応から,フレーズテーブルを作成する
詳しい作成手順については,後述する.また,表1にフレーズテーブルの例を示す.

表: フレーズテーブルの例
新緑 の 季節 $\vert\vert\vert$ during the season of new green leaves $\vert\vert\vert$ (0) (1) () $\vert\vert\vert$ (0) (1) () () ()
() () $\vert\vert\vert$ 0.333333 3.6554e-09 0.166667 1.83964e-19 2.718
新緑 の 季節 $\vert\vert\vert$ during the season $\vert\vert\vert$ (0) (1) () $\vert\vert\vert$ (0) (1) () $\vert\vert\vert$ 0.333333 3.6554e-09
0.166667 2.63823e-07 2.718
新緑 の 季節 に $\vert\vert\vert$ during the season of new green leaves $\vert\vert\vert$ (0) (1) () () $\vert\vert\vert$ (0) (1) ()
() () () () $\vert\vert\vert$ 0.333333 1.26847e-10 0.166667 1.83964e-19 2.718

左から順に,日本語フレーズ,英語フレーズ,フレーズ内単語対応(日英方向),フレーズ内単語対応(英日方向)日英方向の翻訳確率$P(j\vert e)$,日英方向の単語の翻訳確率の積,英日方向の翻訳確率$P(e\vert j)$,英日方向の単語の翻訳確率の積,フレーズペナルティである.ただし,フレーズペナルティの値は,常に自然対数の底である2.718である.


平成23年3月3日