next up previous contents
Next: 句に基づく文パターン辞書の作成 Up: フレーズ辞書(自動)の作成 Previous: フレーズの抽出   目次


フレーズ対数確率の計算

対訳フレーズと単語辞書を用いて, フレーズ対数確率を計算する. 以下にフレーズ対数確率の計算手順を示す.
1. 単語の組み合わせの取得

対訳フレーズにおいて, 英語フレーズの単語と日本語フレーズの単語の全ての組み合わせを得る. 同様に日本語フレーズの単語の組み合わせと英語フレーズの単語の組み合わせも得る.

2. 翻訳確率の計算

日本語単語に対応する英語単語の中で, 単語翻訳確率が最大となる確率を得る. 同様に英語単語に対応する日本語単語の中で, 単語翻訳確率が最大となる確率を得る.

3. フレーズ対数確率の付与

得られた確率に対して対数を取り, 日英方向の単語翻訳確率の対数値の総和と英日方向の単語翻訳確率の対数値の総和を求める. 次に, 日英方向の総和と英日方向の総和を足し合わせて, フレーズのフレーズ対数確率として付与する.

4.3に日英フレーズ対数確率の付与手順を示す.

図 4.3: 日英フレーズ対数確率の付与手順
38#38

4.3に英日方向のフレーズの例として``"多くの学生 39#39 many students" を示す. まず, 日本語句の単語と英語句の単語の全ての組み合わせを得る. 次に, 単語翻訳確率を用いて, 各組み合わせの中から最大となる単語翻訳確率を得る. 図4.3では``"多く 39#39 many" に付与された確率``0.92" が最も高いため, 0.92に対して対数を取る. ``"の", "学生" も同様に単語翻訳確率に対数を取り総和を求める.



s122053 2016-03-04