next up previous contents
Next: 言語モデル Up: 日英統計翻訳システム Previous: 日英統計翻訳システム   目次

概要

統計翻訳において,「単語に基づく統計翻訳」と,「句に基づく統計翻訳」がある. 初期の統計翻訳は,単語に基づく統計翻訳であった.しかし,近年提案された句に基づく統計翻訳[1]は,語順の並び替えや文脈における訳語の選択や翻訳精度において,単語に基づく統計翻訳よりも優れている.そのため,現在は句に基づく統計翻訳が主流となっている.したがって,本研究では,統計翻訳システムにおいて,句に基づく統計翻訳を用いる. 日英統計翻訳では,日本語文$j$を入力文とした場合,翻訳モデル$P(j\vert e)$と言語モデル$P(e)$の全ての組み合わせから,確率が最大となる英語文$\hat{e}$を探索し,出力文とする.$E$を探索する翻訳システムをデコーダと呼ぶ.以下に基本的なモデルを示す.また,日英統計翻訳の流れを図[*]に示す.

$\displaystyle E$ $\textstyle =$ $\displaystyle arg\displaystyle \max_{e}P(e\vert j)$ (1)
  $\textstyle \simeq$ $\displaystyle arg\displaystyle \max_{e}P(j\vert e)P(e)$ (2)


図: 日英統計翻訳の流れ



s122019 2016-03-03