Next: 実験結果
Up: 追加実験2(提案手法を拡張した実験)
Previous: 追加実験2(提案手法を拡張した実験)
目次
拡張手法は大きく分けて4つの手順で構成される.提案手法との違いは,手順3において,翻訳できなかった未知語を文字単位に分割して再度翻訳する処理が加わっている点である.日英統計翻訳における拡張手法の流れを図7.3に示す.また,以下に拡張手法の具体的な手順を示す.
- 手順1
- 任意の機械翻訳器における出力文から未知語を抽出し未知語リスト1を作成する
- 手順2
- GIZA++を用いて対訳学習文から対訳単語を獲得し,対訳単語辞書を作成する
- 手順3.1
- 手順2で作成した対訳単語辞書を用いて未知語リスト1を翻訳(単語翻訳)し
未知語リスト2を作成する(訳語が複数存在する場合は翻訳確率が最尤のもの
を選択)
- 手順3.2
- 未知語リスト2において漢字だけで構成される2文字以上の単語(漢字未知語)
を文字単位に分割し未知語リスト3を作成する
- 手順3.3
- 手順2で作成した対訳単語辞書を用いて未知語リスト3を翻訳(文字翻訳)し
未知語リスト4を作成する(訳語が複数存在する場合は翻訳確率が最尤のもの
を選択)
- 手順4
- 未知語処理前の文に対し未知語リスト4を適用
s122019
2018-02-15