next up previous contents
次へ: 翻訳モデル 上へ: 日英統計翻訳システム 戻る: 日英統計翻訳システム   目次

基本的な考え方

日英統計翻訳は,日本語文$ J$ が与えられたとき,全ての組み合わせの中から確 率 $ P(E \mid J)$ が最大になる英語文$ \hat{E}$ を探索することによって翻訳を 行う.以下に基本モデルを示す.
$\displaystyle \hat{E}$ $\displaystyle =$ $\displaystyle \underset{E}{argmax}P(E \mid J)$ (1)
  $\displaystyle \simeq$ $\displaystyle \underset{E}{argmax}P(J \mid E)P(E)$ (2)

$ P(J \mid E)$ は翻訳モデル,$ P(E)$ は言語モデルと呼ぶ.また,$ \hat{E}$ を探 索する翻訳システムをデコーダと呼ぶ.式[*]は,ベイズの法則に より,式[*]に展開される.これは,2言語間のモデル $ P(E \mid J)$ を正確に推定することが困難なためである.そのため,一般に,高い信頼性を持 つことが知られている言語モデルを翻訳モデルと併用し,翻訳の精度を高めている.



平成22年2月17日