デコーダのパラメータ

次へ: 学習データ 上へ: 実験環境 戻る: 言語モデルの学習目次

デコーダのパラメータ

デコーダには``moses[5]''を使用する．mosesはいくつかのパラメータを設定することが出来る．パラメータの最適値を決めるパラメータチューニングには， Minimum Error Rate Training(MERT)という手法を用いることが一般的である． MERTは目的の評価関数(通常BLEU)を最大にするような翻訳結果が選ばれるように，パラメータを調整する．この際，developmentデータと呼ばれる，試し翻訳を行なうデータを与え，各文について上位100個程度の翻訳候補を出力し，その候補の中で重みを変え，より良い翻訳候補が上位にくるようにパラメータを調節する．しかし，MERTによって生成されるパラメータは，developmentデータに依存する．また，チューニングには多くの時間がかかる．そのため，本研究ではチューニングを行なわず，デフォルトの値を利用する．

ただし，翻訳モデルには，日英翻訳確率と英日翻訳確率の共起確率を用いたほうが良い結果が得られる [6]．そこで，翻訳モデルの重み``weight-t''は``0.5 0.0 0.5 0.0 0.0''とする．また，日本語から英語への翻訳では，動詞の位置が大きく変化する．そこで，フレーズの並び替え確率の重み``distortion weight''は``0.2''とする．

平成20年3月25日