翻訳モデルと言語モデルとデコーダ

次へ: 評価方法 上へ: 翻訳実験 戻る: テストデータ

フレーズテーブルの作成
翻訳モデルはフレーズテーブルで管理される．フレーズテーブルの作成には，train-phrase-model.perl[12]を用いて自動的に作成する．尚，本稿では，プログラムで自動作成した単語列の対訳対をフレーズ対と呼ぶ．また，フレーズ対の最大の単語数を決めるmax phrase lengthは20とする．
-gram モデルの学習
言語モデルには， -gramモデルを用いる． -gramモデルの学習には， ``SRILM[13]''を用いる．本研究では5-gramモデルを用いる．また，スムージングのパラメータには，Kneser-Neyである``-ukndiscount''を用いる．
デコーダ
デコーダは``moses[4]''を用いる．また，翻訳モデルには，日英翻訳確率と英日翻訳確率の相互情報を用いる[14]．したがって，翻訳モデルの重み``weight-t''は``0.5 0 0.5 0 0''とする．また，翻訳時にフレーズの位置の変化に柔軟に対応するため，単語の移動重み``weight-d''は0.2とする．また単語の移動距離の制限''distortion-limit''は，-1（無制限を意味）とする．その他は，default値とする．

Jin'ichi Murakami 平成22年9月2日