next up previous contents
次へ: 言語モデルの学習 上へ: 実験環境 戻る: 学習データの数   目次

翻訳モデルの学習

翻訳モデルはフレーズテーブルで管理されている. フレーズテーブルの学習には,多くの方法がある. 本実験では,Mosesの付録である`` train-factored-phrase-model.perl''[7] を用いる. このプログラムはGIZA++を利用し,IBMモデルの計算を行う.本研究では,フレーズテーブルのヒューリスティックとして``grow-diag-final-and''を用いる. また,フレーズテーブルを作成する際,フレーズテーブル内の日本語と英語のフレーズ中の単語数の上限として,max-phrase-lengthが定義されている. たとえば,max-phrase-lengthの値が7の場合,日本語か英語のいずれかのフレーズ中の単語数が,8以上のフレーズ対は作成されない. 本研究では,max-phrase-lengthの値として,はデフォルト値の7を用いる.



平成23年3月23日