next up previous contents
次へ: IBMモデル 上へ: 統計翻訳システム 戻る: 基本概念   目次

翻訳モデル

翻訳モデルは日本語の単語列から英語の単語列へ確率的に翻訳を行うためのモデルである. 翻訳モデルには,大きくわけて語に基づく翻訳モデルと句に基づく翻訳モデル[5]がある. 初期の統計翻訳は,語に基づく翻訳モデルを用いていた. しかし,翻訳確率の高さから,現在では句に基づく翻訳モデルが主流となっている. 句に基づく翻訳モデルは表2.1に示すフレーズテーブルで管理される.


表: フレーズテーブルの例
2 0 秒 $\mid \mid \mid $ twenty seconds $\mid \mid \mid $ 0.5 0.133 1 0.013 2.718
あらし $\mid \mid \mid $ the storm $\mid \mid \mid $ 0.0625 0.245 0.0476 0.0353 2.718
その 博物館 $\mid \mid \mid $ the museum $\mid \mid \mid $ 0.125 0.037 0.142 0.201 2.718 
その 馬 $\mid \mid \mid $ the horse $\mid \mid \mid $ 0.25 0.0575 0.0454 0.182 2.718

左から,日本語フレーズ,英語フレーズ, フレーズの英日翻訳確率 $P(j\vert e)$ ,英日方向の単語の翻訳確率(IBMモデル)の積, フレーズの日英翻訳確率 $P(e\vert j)$ ,日英方向の単語の翻訳確率(IBMモデル)の積,フレーズのペナルティである. 以後,フレーズペナルティは常に一定の値であるため省略する.



Subsections

平成23年3月23日