次へ: 言語モデルの学習
上へ: 実験環境
戻る: 日英対訳コーパス
目次
翻訳モデルはフレーズテーブルで管理されている.
フレーズテーブルの学習には,多くの方法がある.
本研究では,Mosesの付録である``train-model.perl"[9] を用いる.
このプログラムはGIZA++を利用し,IBMモデルの計算を行う.本研究では,フレーズテーブルのヒューリスティックとして``grow-diag-final''を用いる.
また,フレーズテーブルを作成する際,フレーズテーブル内の日本語と英語のフレーズ中の単語数の上限として,max-phrase-lengthが定義されている.
たとえば,max-phrase-lengthの値が7の場合,日本語か英語のいずれかのフレーズ中の単語数が,8以上のフレーズ対は作成されない.
本研究では,max-phrase-lengthの値は20を用いる.
平成25年2月12日