Next: 翻訳モデル Up: 従来の研究 Previous: GIZA++ 目次

句に基づく統計翻訳

句に基づく統計翻訳は句対応の翻訳モデルを用いる. 原言語文を目的言語文に翻訳する場合に, 隣接する複数のフレーズを用いて翻訳を行う方法である. 日英統計翻訳は，日本語入力文

が与えられた場合に，翻訳モデルと言語モデルの組み合わせの中から確率が最大となる英語翻訳文

を探索することで翻訳を行う．以下にその基本モデルを示す.

$\displaystyle E$	$\displaystyle =$	$\displaystyle argmax_{j}P(e\vert j)$	(2.21)
	$\displaystyle \simeq$	$\displaystyle argmax_{j}P(j\vert e)P(e)$	(2.22)

ここで $P(j\vert e)$ は翻訳モデル，

は言語モデルを示す．

が単語であれば``単語に基づく統計翻訳''のモデル，

が句であれば，``句に基づく統計翻訳''のモデルとなる．
また，学習データとは対訳文(英語文と日本語文の対)を大量に用意したものである. 学習データに含まれる各々のデータから, 翻訳モデルと言語モデルを学習する.

2015-03-21