次へ: 実験
上へ: 提案手法
戻る: PATTERN法
目次
SENTENCE法は,対訳文1文につき全ての単語レベル文パターンの中から対数フレーズ確率の総和が最大の対訳句を出力する.つまり,対訳文に適合する全ての単語レベル文パターンにPATTERN法を適用し,その中から対数フレーズ確率の総和が最大となる対訳句を出力する.SENTENCE法の対訳句の抽出手順を以下に示す.
- 手順1
- 対訳文と単語レベル文パターンを表2.10とし,パターンを照合する.
- 手順2
- 適合した場合,単語レベル文パターンの変数部に対応する全ての組み合わせの対訳句を抽出する.
- 手順3
- GIZA++の単語確率を用いて,各組み合わせの中から最大となる単語確率を得る
- 手順4
- 得られた単語確率を用いて,対数フレーズ確率を計算する.
ここまでは,従来手法と同様の手順.
- 手順5
- 全ての単語レベル文パターンの対訳句の中から,手順5で計算した対数フレーズ確率の総和が一番高い対訳句を1つだけ選出する.
- 手順6
- 手順6で選出した対訳句を最終的に抽出される対訳句として出力する.
図3.2にSENTENCE法の具体例を示す.
単語レベル文パターン1において対訳句の候補は40組,同様に単語レベル文パターン2も対訳句の候補が40組存在する.まず,それらの各候補にPATTERN法を適用させ対数フレーズ確率の総和を計算する.SENTENCE法は,全ての単語レベル文パターンの対訳句の候補から最適な対訳句を1組出力する.つまり,全80組の対訳句の候補の中から対数フレーズ確率の総和が-0.65と一番高い
が出力される.よって,表2.10の場合にSENTENCE法を用いると,対訳句は80組の中から対数フレーズ確率の総和が一番高い3句だけが出力される.
s122025
平成28年3月21日