next up previous contents
次へ: 文法構造の変換による翻訳 上へ: 日英統計翻訳システム 戻る: デコーダー   目次

パラメータチューニング

パラメータチューニングは,デコーダーで用いるパラメータの最適値を設定し,Minimum Error Rate Training(MERT)[7]という手法を用いることが一般的である.MERTは評価関数(通常BLEU)を最大にする翻訳結果が選ばれるために,パラメータを調整する.パラメータチューニングを行う際,developデータと呼ばれる試し翻訳を行うデータを用いる.

developデータの各文から,上位100個程度の翻訳候補を出力し,その候補の中でパラメータの重みを変え,より良い翻訳候補が上位にくるようにパラメータを調整する.しかし,MERTによって生成されたパラメータは,developデータに依存するため,そのパラメータを別のテストデータに使用しても翻訳精度が向上されない場合がある.

日英統計翻訳において,文法構造が単純な単文100文を用いてチューニングを行った場合,30分で終了する.しかし,特許文をはじめとする文法構造が複雑な文100文を用いてチューニングを行った場合,チューニングが終了されるのに,一日以上時間がかかる場合がある.



平成21年3月19日