next up previous contents
次へ: 両方向の単語対応の作成 上へ: 日英統計翻訳システム 戻る: 基本的な考え方   目次

翻訳モデル

翻訳モデルは日本語の単語列から英語の単語列へ確率的に翻訳を行うためのモ デルである.翻訳モデルには,大きくわけて語に基づく翻訳モデルと句に基づく 翻訳モデル[5]がある.初期の統計翻訳は,語に基づく翻訳モデルを 用いていた.しかし,翻訳精度の高さから,現在は句に基づく翻訳モデルが主流 となっている.句に基づく翻訳モデルは表[*]に示すフレーズ テーブルと呼ばれる表で管理される.


表: フレーズテーブルの例
$ \vert\vert\vert$ The garden $ \vert\vert\vert$ 0.0434 0.3869 0.0036 0.0261 2.718
$ \vert\vert\vert$ a garden $ \vert\vert\vert$ 0.5 0.7737 0.0073 0.1612 2.718
庭 から $ \vert\vert\vert$ from the garden $ \vert\vert\vert$ 0.5 0.1728 1 0.0327 2.718
庭 から 入る ドア $ \vert\vert$ door from the garden $ \vert\vert\vert$ 1 0.0001 1 0.0147 2.718
庭 が ある $ \vert\vert\vert$ There is a garden $ \vert\vert\vert$ 1 0.0421 1 0.0036 2.718
庭 が 荒れる $ \vert\vert\vert$ The garden is wasted $ \vert\vert\vert$ 1 0.0014 1 0.0001 2.718
庭 で $ \vert\vert\vert$ garden at $ \vert\vert\vert$ 0.3333 0.16471 0.0833 0.0480 2.718

左から,日本語フレーズ,英語フレーズ,フレーズの英日翻訳確率 $ P(j \mid e)$ , 英日方向の単語の翻訳確率(IBMモデル)の積,フレーズの日英翻訳確率 $ P(e \mid j)$ ,日英 方向の単語の翻訳確率(IBMモデル)の積,フレーズペナルティである.以後,フレーズ ペナルティは常に一定の値であるため省略する.本稿では,日本語フレーズ,英 語フレーズ,各種確率の3つをまとめて,フレーズ対と呼ぶ.フレーズ対は,日 本語と英語の単語の対応付けを行い,その対応から日本語フレーズと英語フレー ズの対応を抽出し生成される.



Subsections

平成22年2月17日