次へ: モデル1
上へ: 単語に基づく統計翻訳
戻る: 単語に基づく統計翻訳
目次
統計翻訳の代表的なモデルとして,IBMのBrownらによる仏英翻訳モデル [3]がある.IMB翻訳モデルは,単語に基づく統計翻訳を想定して作成された,単語対応の確率モデルである.この翻訳モデルは順に複雑な計算を行うモデル1から5の5つのモデルで構成される.IBM翻訳モデルでは,フランス語から英語への翻訳を想定しているため,以下の説明では仏英翻訳を前提とする.本章では.原言語であるフランス語文を,目的言語である英語文をとして定義する.
IBMモデルでは,フランス語文,英語文の翻訳モデルを計算するために,アライメントを用いる.以下にIBMモデルの基本式を示す.
|
|
|
(3.1) |
アライメントとは仏単語と英単語の対応を意味している.IBMモデルのアライメントでは,各仏単語に対応する英単語は1つあり,各英単語に対応する仏単語は0からn個ある.また仏単語において適切な英単語と対応しない場合,英語文の先頭に空単語があると仮定し,その仏単語と空単語を対応づける.
Subsections
平成26年3月13日