next up previous contents
次へ: 提案手法 上へ: パターンに基づく統計翻訳システム 戻る: b)対数文パターン確率の付与   目次


文生成

句に基づく対訳文パターンと対訳句を用いて,文生成を行う.まず,日本語文パターンと入力文を照合し,入力文に適合する日本語文パターンを選択する.なお,日本語文パターンの選択には入力文と日本語文パターンの字面を比較し,字面が多く一致する文パターンを優先して選択する.そして,日本語文パターンに対応する英語文パターンと対数文パターン確率を取得する.次に対訳句を用いて文パターンの変数部に適合する局所的な要素の翻訳を行う.パターンに基づく統計翻訳は変数に品詞情報などの制約がないため,日本語の要素を英語に翻訳する場合,多数の翻訳候補がある.そこで,局所的な要素の翻訳は対訳句に付与された対数フレーズ確率と$ N$ -gramモデルを用いて絞り込みを行う.具体的には各要素に用いられた対訳句の対数フレーズ確率と生成された文の$ N$ -gramモデルの総和を求め,その総和が最大となる文を選択された文パターンにおける翻訳候補文とする.パターンに基づく統計翻訳において,$ N$ -gramモデルは3-gramを用いる.各適合する文パターン対して同様の処理を行い,入力文に対する翻訳候補文を生成する.

最後に,翻訳候補文から翻訳文の選択を行う.翻訳文の選択には文生成に用いた対訳文パターンの対数文パターン確率と対訳句の対数フレーズ確率,$ N$ -gramモデル(3-gram)を用いる.各翻訳候補文の対数文パターン確率と対数フレーズ確率,$ N$ -gramモデル(3-gram)の総和を求め,翻訳候補文の中で総和が最大となる文を翻訳文として出力する.



平成27年3月13日