次へ: 言語モデルの学習
上へ: 実験環境
戻る: 学習データの数
目次
翻訳モデルはフレーズテーブルで管理されている.
フレーズテーブルの学習には,多くの方法がある.
本実験では,Mosesの付録である`` train-factored-phrase-model.perl''[7] を用いる.
このプログラムはGIZA++を利用し,IBMモデルの計算を行う.本研究では,フレーズテーブルのヒューリスティックとして``grow-diag-final-and''を用いる.
また,フレーズテーブルを作成する際,フレーズテーブル内の日本語と英語のフレーズ中の単語数の上限として,max-phrase-lengthが定義されている.
たとえば,max-phrase-lengthの値が7の場合,日本語か英語のいずれかのフレーズ中の単語数が,8以上のフレーズ対は作成されない.
本研究では,max-phrase-lengthの値として,はデフォルト値の7を用いる.
平成23年3月23日