次へ: SENTENCE法
上へ: 提案手法
戻る: 提案手法の概要
目次
PATTERN法は,その単語レベル文パターンごとに対数フレーズ確率の総和が最大の対訳句を出力する手法である.PATTERN法の対訳句の抽出手順を以下に示す.
- 手順1
- 対訳文と単語レベル文パターンを表2.10とし,パターンを照合する.
- 手順2
- 適合した場合,単語レベル文パターンの変数部に対応する全ての組み合わせの対訳句を抽出する.
- 手順3
- GIZA++の単語確率を用いて,各組み合わせの中から最大となる単語確率を得る
- 手順4
- 得られた単語確率を用いて,対数フレーズ確率を計算する.
ここまでは,従来手法と同様の手順.
- 手順5
- 各単語レベル文パターンごとに,手順5で計算した対数フレーズ確率の総和の最大値をとる対訳句を1つずつ選出する.
- 手順6
- 手順6で選出した対訳句を最終的に抽出される対訳句として出力する.
図3.1に,PATTERN法の具体例を示す.
従来手法と同様,単語レベル文パターン1で対訳句の候補が40組存在する.PATTERN法は,各組ごとに対数フレーズ確率の総和を計算し,その中から総和が最大となる1組を出力する.つまり、単語レベル文パターン1で出力される対訳句は,対数フレーズ確率の総和が-0.65と一番高い
となる.同じ方法を,単語レベル文パターン2でも行い(2)を出力する.そして,各単語レベル文パターンごとに選ばれた対訳句の数を合わせ出力する.つまり,表2.10の場合にPATTERN法を用いると,対訳句は単語レベル文パターン1と2を合わせた6句のみが出力される.
s122025
平成28年3月21日