next up previous contents
次へ: 翻訳モデル 上へ: 統計翻訳システム 戻る: 統計翻訳システム   目次

基本概念

日英統計翻訳は,日本語文jが与えられたとき,全ての組合せの中から確 率が最大となる英語文$\hat{e}$を探索することにより翻訳を行う.
$\displaystyle \hat{e}$ $\textstyle =$ $\displaystyle argmax_e P(e \mid j)$  
  $\textstyle \approx$ $\displaystyle argmax_e P(j \mid e)P(e)$  

$P(j \mid e)$は翻訳モデル,P(e)は言語モデルである. 日英統計翻訳の枠組を図2.1に示す.

図 2.1: 日英統計翻訳の枠組
\fbox{
\includegraphics[width=15cm]{smt.eps}
}

2.1で示すように,翻訳モデルは日本語コーパスと英語コーパス が集まった,学習データから学習して作成する.また,言語モデルは,出力文の 言語である英語コーパスから学習して作成する.翻訳モデルと言語モデルを用い て,$\hat{e}$を探索する翻訳システムが図中のデコーダである.



平成22年2月13日