next up previous contents
次へ: 実験 上へ: 提案手法 戻る: PATTERN法   目次

SENTENCE法

SENTENCE法は,対訳文1文につき全ての単語レベル文パターンの中から対数フレーズ確率の総和が最大の対訳句を出力する.つまり,対訳文に適合する全ての単語レベル文パターンにPATTERN法を適用し,その中から対数フレーズ確率の総和が最大となる対訳句を出力する.SENTENCE法の対訳句の抽出手順を以下に示す.

手順1
対訳文と単語レベル文パターンを表2.10とし,パターンを照合する.
手順2
適合した場合,単語レベル文パターンの変数部に対応する全ての組み合わせの対訳句を抽出する.
手順3
GIZA++の単語確率を用いて,各組み合わせの中から最大となる単語確率を得る
手順4
得られた単語確率を用いて,対数フレーズ確率を計算する.
ここまでは,従来手法と同様の手順.
手順5
全ての単語レベル文パターンの対訳句の中から,手順5で計算した対数フレーズ確率の総和が一番高い対訳句を1つだけ選出する.
手順6
手順6で選出した対訳句を最終的に抽出される対訳句として出力する.

3.2にSENTENCE法の具体例を示す.

図: SENTENCE法の具体例
\fbox{
\includegraphics[width=140mm]{sentence.eps}
}

単語レベル文パターン1において対訳句の候補は40組,同様に単語レベル文パターン2も対訳句の候補が40組存在する.まず,それらの各候補にPATTERN法を適用させ対数フレーズ確率の総和を計算する.SENTENCE法は,全ての単語レベル文パターンの対訳句の候補から最適な対訳句を1組出力する.つまり,全80組の対訳句の候補の中から対数フレーズ確率の総和が-0.65と一番高い $\langle 1 \rangle$が出力される.よって,表2.10の場合にSENTENCE法を用いると,対訳句は80組の中から対数フレーズ確率の総和が一番高い3句だけが出力される.



s122025 平成28年3月21日