next up previous
次へ: 評価方法 上へ: 翻訳実験 戻る: テストデータ

翻訳モデルと言語モデルとデコーダ

  1. フレーズテーブルの作成

    翻訳モデルはフレーズテーブルで管理される.フレーズテーブルの作成に は,train-phrase-model.perl[12]を用いて自動的に作成する.尚, 本稿では,プログラムで自動作成した単語列の対訳対をフレーズ対と呼ぶ.ま た,フレーズ対の最大の単語数を決めるmax phrase lengthは20とする.

  2. $ N$ -gram モデルの学習

    言語モデルには, $ N$ -gramモデルを用いる.$ N$ -gramモデルの学習には, ``SRILM[13]''を用いる.本研究では5-gramモデルを用いる.また,ス ムージングのパラメータには,Kneser-Neyである``-ukndiscount''を用いる.

  3. デコーダ

    デコーダは``moses[4]''を用いる.また,翻訳モデルには,日英翻訳 確率と英日翻訳確率の相互情報を用いる[14].したがって,翻訳モデ ルの重み``weight-t''は``0.5 0 0.5 0 0''とする.また,翻訳時にフレーズの 位置の変化に柔軟に対応するため,単語の移動重み``weight-d''は0.2とする. また単語の移動距離の制限''distortion-limit''は,-1(無制限を意味)とす る.その他は,default値とする.



Jin'ichi Murakami 平成22年9月2日