next up previous contents
次へ: 翻訳モデル 上へ: 句に基づく統計翻訳 戻る: 句に基づく統計翻訳   目次

句に基づく統計翻訳の概要

本研究では日英方向の翻訳を行うため,日英統計翻訳を説明する.日英統計翻訳は,日本語入力文$j$が与えられたとき,翻訳モデルと言語モデルの組み合わせの中から確率が最大となる英語翻訳文êを検索することで翻訳を行う.基本モデルを(2.2)式に示す.


$\displaystyle e = \mathop{\rm arg max}\limits _{e} P(e\vert j)$     (2.1)
$\displaystyle \simeq \mathop{\rm arg max}\limits _{e} P(j\vert e)P(e)$     (2.2)

ここで,$P(j\vert e)$は翻訳モデル,$P(e)$は言語モデルを表す.$P(e)$が単語であれば単語に基づく統計翻訳のモデル,$P(e)$が句であれば句に基づく統計翻訳のモデルとなる.翻訳モデルは対訳学習文,言語モデルは目的言語の単言語学習文から学習する.そして,デコーダを用いて$P(j\vert e)P(e)$が最大となる英語翻訳文êを検索する.日英統計翻訳の手順を図2.1に示す.

図: 日英統計翻訳の手順
\includegraphics[width=15cm]{1.eps}



s122025 平成28年3月21日