next up previous contents
Next: 翻訳モデル Up: 従来の研究 Previous: GIZA++   目次

句に基づく統計翻訳

句に基づく統計翻訳は句対応の翻訳モデルを用いる. 原言語文を目的言語文に翻 訳する場合に, 隣接する複数のフレーズを用いて翻訳を行う方法である. 日英統計翻訳は,日本語入力文$ J$ が与えられた場合に,翻訳モデルと言語モデ ルの組み合わせの中から確率が最大となる英語翻訳文$ E$ を探索することで翻訳 を行う.以下にその基本モデルを示す.


$\displaystyle E$ $\displaystyle =$ $\displaystyle argmax_{j}P(e\vert j)$ (2.21)
  $\displaystyle \simeq$ $\displaystyle argmax_{j}P(j\vert e)P(e)$ (2.22)

ここで$ P(j\vert e)$ は翻訳モデル,$ P(e)$ は言語モデルを示す.$ P(e)$ が単語であれば``単語に基づく統計翻訳''のモデル,$ P(e)$ が句であれば,``句に基づく統計翻訳''のモデルとなる.
また,学習データとは対訳文(英語文と日本語文の対)を大量に用意したものである. 学習データに含まれる各々のデータから, 翻訳モデルと言語モデルを学習する.



2015-03-21