next up previous contents
次へ: 言語モデル 上へ: 句ベース統計翻訳 戻る: 手順6 grow-diag-final-and   目次

手順7 フレーズ対応の抽出

両方向の単語対応から,フレーズ対応を抽出する.そして,抽出したフレーズ対応に対し,翻訳確率を計算し付与することで,フレーズテーブルを作成する.翻訳確率について,日本語フレーズ $ J_{phrase}$ と英語フレー ズ $ E_{phrase}$ からなるフレーズ対応の確率を求める式を以下に示す.


$\displaystyle P(J_{phrase} \mid E_{phrase})$ $\displaystyle =$ $\displaystyle \frac{学習データ中でJ_{phrase}と
E_{phrase}が同時に出現した数}{学習データ中でE_{phrase}が出現した数}$ (2.3)
$\displaystyle P( E_{phrase} \mid J_{phrase})$ $\displaystyle =$ $\displaystyle \frac{学習データ中でJ_{phrase}と
E_{phrase}が同時に出現した数}{学習データ中でJ_{phrase}が出現した数}$ (2.4)



平成25年2月13日