next up previous contents
次へ: Model1 上へ: 翻訳モデル 戻る: 翻訳モデル   目次

IBM翻訳モデル

統計翻訳の手法として,代表的なものにIBMの仏英翻訳モデル[4]がある.IBM翻訳モデルは,Model1からModel5の5つのモデルから成り,順に複雑な計算となる.本研究では日本語から英語への翻訳を行うが,IBM翻訳モデルではフランス語から英語への翻訳を想定しており,2.2.1節では便宜上,原言語をフランス語f,目的言語を英語eとして,説明を行う.IBMモデルでは,フランス語文fと英語文eの翻訳モデル 13#13 を計算するために,アライメントaと呼ばれる概念を導入し,2.4式を考える.


14#14 3#3 15#15 (2.4)

アライメントaとは,ある仏単語fと英単語eの対応関係を示す.IBM翻訳モデルでは英単語は1:nの対応を持ち,仏単語は1つの英単語のみと対応すると仮定する.また,英語文頭に特殊文字 16#16 があるとし,仏単語の対応として適切な英単語がなかった場合はそこに対応づける.フランス語英語翻訳における,アライメントの例2.2を図に示す.

図: フランス語英語翻訳における,アライメントの例
17#17

翻訳モデルのパラメータはEMアルゴリズムを用いて推定する.一般に初期値としては,より簡単なモデルから得られた推定値を与えることで,より信頼性の高い値を得ることができる.次に各モデルについての詳しい説明を行う.



Subsections

平成24年3月23日