next up previous contents
Next: 句に基づく対訳文パターンの作成 Up: 対訳フレーズ辞書の作成 Previous: 対訳フレーズ辞書の作成   目次

対訳フレーズ対数確率

抽出した対訳フレーズにGIZA++の値を用いて,対訳フレーズ対数確率を付与する. 対訳フレーズ対数確率は,以下の式(1)に示す.

106#106
107#107
108#108;日本語の単語 N;日本語の単語数
109#109;英語の単語 M;英語の単語数
110#110;英単語109#109が日本単語108#108に翻訳される確率(GIZA++の値)

対訳フレーズ対数確率にも,[*]節の単語翻訳確率と同じ ように日英方向と英日方向がある. 日英対訳フレーズ対数確率を付与する方法は,抽出した対訳フレーズの日本語単語と 英語単語の日英方向の全ての組み合わせを得る.単語辞書の単語翻訳確率を用いて,各 組み合わせから最大となる単語翻訳確率を得る.そして,単語翻訳確率の対数を とり総和を求める.この総和が日英対訳フレーズ対数確率となる.同様の処理を, 英日方向に対しても行い,英日対訳フレーズ対数確率を得る.日英対訳フレーズ対数確率の付与を図[*]に,英日対訳フレーズ対数確率の付与を図[*]に示す.

図: 日英方向の対訳フレーズ対数確率の付与
111#111

図: 英日方向の対訳フレーズ対数確率の付与
112#112



s122036 2016-03-17