next up previous contents
次へ: 翻訳モデル 上へ: 統計翻訳システム 戻る: 統計翻訳システム   目次

概要

統計翻訳とは, 翻訳モデルより導き出された言語間の句の出現確率と,言語モデルにより導き出された単語の遷移確率の統計より,最適の翻訳結果を自動的に出力する翻訳方法である.現在の統計翻訳では``句に基づく統計翻訳''が主流である.句に基づく統計翻訳は,文脈における訳語の選択や語順の並び替えの精度において,``単語に基づく統計翻訳''より優れているためである.よって本研究でも,句に基づく統計翻訳を用いる. 図2.1に日英統計翻訳の例を示す.

図: 統計翻訳の流れ
\fbox{
\includegraphics[width=9cm]{hon.eps}
}

日英統計翻訳では,日本語入力文を$J$とすると,翻訳モデル$P(J\vert E)$と言語モデル$P(E)$の全ての組み合わせから,確率が最大になる英語文$\hat{E}$を出力文とする.また,$\hat{E}$ を探索する翻訳システムをデコーダと呼ぶ.

以下にその基本モデルを示す.

$\displaystyle \hat{E}$ $\textstyle =$ $\displaystyle \arg \max_E P(E\vert J)$ (2.1)
  $\textstyle \simeq$ $\displaystyle \arg \max_E P(J\vert E)P(E)$ (2.2)



s102025 平成27年3月9日