next up previous contents
次へ: フレーズ対応の抽出 上へ: 翻訳モデル 戻る: 翻訳モデル   目次

両方向の単語対応の作成

日本語と英語の単語の対応付けは,IBMモデルを用いて行う. IBMモデルにより得られる単語の対応関係は,日英方向や英日方向といった,片 方向の対応関係である.統計翻訳では,より精度の高い単語の対応関係として, 片方向の対応関係から両方向の対応関係を作成する.両方向の単語の対応関係の 作成例を図[*]に示す.

図: 両方向の単語の対応関係
\includegraphics[scale=0.8, clip]{alignment_word.eps}

英日方向と日英方向の単語の対応関係から,両方向の単語の対応関係を求めるた めのオプションに``intersection''がある.これは,英日方向と日英方向の両方 に対応がある点を,両方向の対応点にするオプションである.図 [*]の両方向の単語の対応において,黒いマスが ``intersection''の対応点である.

また,``intersection''を拡張したオプションに``grow-diag''がある.これは, ``intersection''の対応点に加えて,片方向で対応点があり,かつ, ``intersection''の対応点と隣り合う点を,両方向の対応点にするオプションで ある.図[*]の両方向の単語の対応において,``は''と ``the''の対応を除く灰色のマスが``grow-diag''で拡張した対応点である.

さらに,``grow-diag''を拡張としたオプションに,``grow-diag-final''と ``grow-diag-final-and''がある.``grow-diag-final''は,片方向で対応点があ り,かつ,``grow-diag''において少なくとも片方の言語の単語の対応がない点 を,``grow-diag''の対応点に追加するオプションである.図 [*]の両方向の単語の対応において,``は''と``the''の対応 が``grow-diag-final''で拡張した対応点である.``grow-diag-final-and''は,片方向で対応点があ り,かつ,``grow-diag''において両方の言語の単語の対応がない点を, ``grow-diag''の対応点に追加するオプションである.図[*]の 両方向の単語の対応において,``は''と``the''の対応が``grow-diag-final''で は拡張されるが,``grow-diag-final-and''は``the''に対応する点があるため, 拡張されない.



平成22年2月17日