次へ: 実験条件
上へ: 提案手法
戻る: 英日文パターン辞書の作成手順
目次
翻訳文生成の手順
翻訳文生成の手順を以下に示す.なお,手順1から手順3までが翻訳候補生成の手順,手順4と手順5が翻訳候補文から翻訳文を選択する手順である.
- 手順1
- 入力文を読み込み,入力文に一致する英語文パターンを選択する.5.2の例では入力文として "She is a teacher ." が読み込まれ,英語文パターン "
1 is a
2 ." が選択される.
- 手順2
- 一致する英語文パターンが存在する場合,変数部に対応する英単語を英日対訳単語辞書を用いて日本語単語に翻訳する.5.2では変数部
1に対応する "She" を "彼女" に,
2に対応する "teacher" を "先生" に翻訳する.
- 手順3
- 英語文パターンに対応する日本語文パターンの変数部を英日対訳単語辞書を用いて日本語単語に置き換える.5.2では日本語文パターンの
1に当たる部分を "彼女" に,
2に当たる部分を "先生" に置き換えている.結果として, "彼女 は 先生 です 。"や"彼女 は 先生 だ 。"などの翻訳候補文が生成される.
図5.2に翻訳候補文生成までの手順を示す.
- 手順4
- 複数の翻訳候補が出力された場合,tri-gramモデルを用いて翻訳候補の絞込みを行う. tri-gramの学習データは英日対訳学習文の日本語学習文を用いる.候補文に対しtri-gramのスコアが存在しない場合はペナルティーとして -1,000 を付与する.5.3のスコア計算において,候補文をtri-gramモデル化し,学習データと照合する.例えば, 翻訳候補文 "彼女 は 先生 です 。" は照合した結果, スコア-999.4が与えられる.
- 手順5
- tri-gramスコアが最大となる翻訳候補文を翻訳文として出力する.図5.3では候補文の中で最もスコアが高い "彼女 は 先生 です 。" が翻訳文として出力される.
本実験では翻訳結果を分類するために翻訳文のtri-gramスコアに閾値を設ける. tri-gram学習データと閾値の詳細は6.2節で述べる.
図5.3に翻訳文選択までの手順を示す.
eki takashi
平成24年3月13日