next up previous contents
Next: 言語モデル Up: 日英統計翻訳 Previous: 概要   目次

句に基づく統計翻訳

句に基づく統計翻訳は句対応の翻訳モデルを用いる.また,原言語文を目的言語文に翻訳する場合に,隣接する複数の単語を用いて翻訳を行う.本研究では日英翻訳を行うため,日英統計翻訳を説明する. 日英統計翻訳では,日本語文$j$を入力文とした場合,翻訳モデル$P(j\vert e)$と言語モデル$P(e)$の全ての組み合わせから,確率が最大となる英語文$\hat{e}$を探索し,出力文とする.$E$を探索する翻訳器をデコーダと呼ぶ.以下に基本的なモデルを示す.また,日英統計翻訳の流れを図2.1に示す.



$\displaystyle E$ $\textstyle =$ $\displaystyle arg\displaystyle \max_{e}P(e\vert j)$ (2.1)
  $\textstyle \simeq$ $\displaystyle arg\displaystyle \max_{e}P(j\vert e)P(e)$ (2.2)

ここで,$P(e)$が単語の場合は``単語に基づく翻訳翻訳"のモデル,$P(e)$が句の場合は``句に基づく統計翻訳"のモデルとなる.

図 2.1: 日英統計翻訳の流れ
\includegraphics[width=130mm]{SMTmethod.eps}



s122019 2018-02-15