next up previous contents
次へ: 言語モデルの学習 上へ: 実験環境 戻る: 日英対訳コーパス   目次

翻訳モデルの学習

翻訳モデルはフレーズテーブルで管理されている. フレーズテーブルの学習には,多くの方法がある. 本研究では,Mosesの付録である``train-model.perl"[9] を用いる. このプログラムはGIZA++を利用し,IBMモデルの計算を行う.本研究では,フレーズテーブルのヒューリスティックとして``grow-diag-final''を用いる. また,フレーズテーブルを作成する際,フレーズテーブル内の日本語と英語のフレーズ中の単語数の上限として,max-phrase-lengthが定義されている. たとえば,max-phrase-lengthの値が7の場合,日本語か英語のいずれかのフレーズ中の単語数が,8以上のフレーズ対は作成されない. 本研究では,max-phrase-lengthの値は20を用いる.



平成25年2月12日