次へ: 学習データ
上へ: 実験環境
戻る: 言語モデルの学習
目次
デコーダには``moses[5]''を使用する.mosesはいくつかのパラメータを設
定することが出来る.パラメータの最適値を決めるパラメータチューニングには,
Minimum Error Rate Training(MERT)という手法を用いることが一般的である.
MERTは目的の評価関数(通常BLEU)を最大にするような翻訳結果が選ばれるように,
パラメータを調整する.この際,developmentデータと呼ばれる,試し翻訳を行
なうデータを与え,各文について上位100個程度の翻訳候補を出力し,その候補
の中で重みを変え,より良い翻訳候補が上位にくるようにパラメータを調節する.
しかし,MERTによって生成されるパラメータは,developmentデータに依存する.
また,チューニングには多くの時間がかかる.そのため,本研究ではチューニン
グを行なわず,デフォルトの値を利用する.
ただし,翻訳モデルには,
日英翻訳確率と英日翻訳確率の共起確率を用いたほうが良い結果が得られる
[6].そこで,翻訳モデルの重み``weight-t''は``0.5 0.0 0.5 0.0 0.0''とする.また,
日本語から英語への翻訳では,動詞の位置が大きく変化する.そこで,フレーズ
の並び替え確率の重み``distortion weight''は``0.2''とする.
平成20年3月25日