next up previous contents
Next: 句に基づく対訳文パターン辞書の作成 Up: Pattern Based SMTによる出力文生成の手順 Previous: 単語に基づく対訳文パターンの作成   目次

対訳フレーズ辞書の作成

対訳文と単語に基づく対訳文パターンを照合し,変数部に対 応する対訳フレーズを抽出する.抽出した対訳フレーズに対訳単語辞書を用いて, 対訳フレーズ対数確率を付与した,“対訳フレーズ辞書”を作成する.対訳フレー ズ辞書の作成を図3.3にに示す.

図 3.3: 対訳フレーズ辞書の作成
\fbox{
\includegraphics[scale=0.8]{phrase_dic.eps}
}

対訳フレーズ対数確率にも,3.2.1節の単語翻訳確率と同じ ように日英方向と英日方向がある. 日英対訳フレーズ対数確率を付与する方法は,抽出した対訳フレーズの日本語単語と 英語単語の日英方向の全ての組み合わせを得る.単語辞書の単語翻訳確率を用いて,各 組み合わせから最大となる単語翻訳確率を得る.そして,単語翻訳確率の対数を とり総和を求める.この総和が日英対訳フレーズ対数確率となる.同様の処理を, 英日方向に対しても行い,英日対訳フレーズ対数確率を得る.日英対訳フレーズ対数確率の付与を図3.4に,英日対訳フレーズ対数確率の付与を図3.5に示す.

図 3.4: 日英方向の対訳フレーズ対数確率の付与

図 3.5: 英日方向の対訳フレーズ対数確率の付与
\fbox{
\includegraphics[scale=0.6]{phrase_prob_ej.eps}
}



2015-03-21