next up previous contents
次へ: 言語モデル 上へ: 日英統計翻訳システム 戻る: 基本モデル   目次

翻訳モデル

翻訳モデルは日本語の単語列から英語の単語列へ確率的に翻訳を行なうためのモ デルである.翻訳モデルはフレーズテーブルと呼ばれる表で管理される.以下に その例を示す.

フレーズテーブルの例
$ \vert\vert\vert$ The garden $ \vert\vert\vert$ 0.0434783 0.386981 0.00367647 0.0260218 2.718
$ \vert\vert\vert$ a garden $ \vert\vert\vert$ 0.5 0.773743 0.00735294 0.161246 2.718
庭 から $ \vert\vert\vert$ from the garden $ \vert\vert\vert$ 0.5 0.1728 1 0.0327616 2.718
庭 から 入る ドア $ \vert\vert$ door from the garden $ \vert\vert\vert$ 1 0.000126482 1 0.0146999 2.718
庭 が ある $ \vert\vert\vert$ There is a garden $ \vert\vert\vert$ 1 0.0420398 1 0.00361794 2.718
庭 が 荒れる $ \vert\vert\vert$ The garden is wasted $ \vert\vert\vert$ 1 0.00144216 1 0.000990969 2.718
庭 で $ \vert\vert\vert$ garden at $ \vert\vert\vert$ 0.333333 0.16471 0.0833333 0.0480066 2.718

左から,日本語フレーズ,英語フレーズ,フレーズの英日翻訳確率 $ P(j \mid e)$ , 英日方向の単語の翻訳確率(IBMモデル)の積,日英翻訳確率 $ P(e \mid j)$ ,日英 方向の単語の翻訳確率(IBMモデル)の積,フレーズペナルティ(常に自然対数の底 $ e = 2.718$ である.

また,フレーズテーブルを生成する際,フレーズ中の単語数 の上限として,max-phrase-lengthが定義されている.例えば,max-phrase-length が7の場合,英日いずれかのフレーズ中の単語数が,8以上の単語列は生成さ れない.



平成20年3月25日