next up previous contents
次へ: 日英統計翻訳システム 上へ: はじめに 戻る: はじめに   目次

関連研究

関連研究として,鏡味ら[3]は長いフレーズを持つフレーズ対として, 人手で作成された日本語フレーズと英語フレーズの対応に確率を付与した.しか し,人手でフレーズ対応を作成するには,多くの時間がかかり,低コストで翻訳 システムを構築できるという統計翻訳の長所が損なわれる.また,フレーズ対応 に適当な確率を付与することは難しい.

村上ら[4]は,長いフレーズを持つフレーズ対を生成するために, 学習に用いられるオプション``max-phrase-length''の値を変更した. ``max-phrase-length''は,フレーズテーブル内の日本語と英語のフレーズ中の 単語数の上限値であり,7がデフォルトの値である.デフォルトの値はフランス 語と英語の翻訳のために設定された値である.村上らは対応する単語の位置が大 きく変化する日本語と英語の翻訳では,フレーズが長いほどフレーズ対の精度が よくなるとし,``max-phrase-length''の値を20とした.本研究でも同様の考え から,``max-phrase-length''の値は学習データの単語数の上限である100とする.



平成22年2月17日