next up previous contents
次へ: 対訳句の選別 上へ: フレーズ辞書の作成 戻る: 対訳句の抽出   目次


フレーズ対数確率の計算

  1. 単語の組み合わせの取得

    対訳句において, 英語句の単語と日本語句の単語の全ての組み合わせを得る. 同様に日本語句の単語の組み合わせと英語句の単語の組み合わせも得る.

  2. 単語翻訳確率の計算

    英単語に対応する日本語単語の中で, 単語翻訳確率が最大となる確率を得る. 同様に日本語単語に対応する英単語の中で, 単語翻訳確率が最大となる確率を得る.

  3. フレーズ対数確率の付与

    得られた確率に対して対数を取り, 英日方向の単語翻訳確率の対数値の総和と日英方向の単語翻訳確率の対数値の総和を求める. 次に, 英日方向の総和と日英方向の総和を足し合わせて, 対訳句のフレーズ対数確率として付与する.

4.4に英日フレーズ対数確率の付与手順を示す.

図: 英日フレーズ対数確率の付与手順
51#51

4.4に英日方向の対訳句の例として ``many students 48#48 多くの学生" を示す. まず, 英語句の単語と日本語句の単語の全ての組み合わせを得る. 次に, 単語翻訳確率を用いて, 各組み合わせの中から最大となる単語翻訳確率を得る. 図4.4では ``many 48#48 多く" に付与された確率 ``0.81" が最も高いため, 0.81に対して対数を取る. ``students" も同様に単語翻訳確率に対数を取り総和を求める.

0


平成27年3月19日