next up previous contents
次へ: SENTENCE法 上へ: 提案手法 戻る: 提案手法の概要   目次

PATTERN法

PATTERN法は,その単語レベル文パターンごとに対数フレーズ確率の総和が最大の対訳句を出力する手法である.PATTERN法の対訳句の抽出手順を以下に示す.

手順1
対訳文と単語レベル文パターンを表2.10とし,パターンを照合する.
手順2
適合した場合,単語レベル文パターンの変数部に対応する全ての組み合わせの対訳句を抽出する.

手順3
GIZA++の単語確率を用いて,各組み合わせの中から最大となる単語確率を得る
手順4
得られた単語確率を用いて,対数フレーズ確率を計算する.
ここまでは,従来手法と同様の手順.
手順5
各単語レベル文パターンごとに,手順5で計算した対数フレーズ確率の総和の最大値をとる対訳句を1つずつ選出する.
手順6
手順6で選出した対訳句を最終的に抽出される対訳句として出力する.

3.1に,PATTERN法の具体例を示す.

図: PATTERN法の具体例
\fbox{
\includegraphics[width=140mm]{pattern.eps}
}

従来手法と同様,単語レベル文パターン1で対訳句の候補が40組存在する.PATTERN法は,各組ごとに対数フレーズ確率の総和を計算し,その中から総和が最大となる1組を出力する.つまり、単語レベル文パターン1で出力される対訳句は,対数フレーズ確率の総和が-0.65と一番高い $\langle 1 \rangle$となる.同じ方法を,単語レベル文パターン2でも行い(2)を出力する.そして,各単語レベル文パターンごとに選ばれた対訳句の数を合わせ出力する.つまり,表2.10の場合にPATTERN法を用いると,対訳句は単語レベル文パターン1と2を合わせた6句のみが出力される.



s122025 平成28年3月21日