next up previous contents
次へ: 言語モデル 上へ: 翻訳モデル 戻る: GIZA++   目次

フレーズテーブルの作成

GIZA++よりIBM翻訳モデルを推定することで最尤な単語対応を得る.これを日英,英日の両方向に対して行う.日本語文``彼は犬を優しく世話した"とその対訳英語文``He treated his dog kindly"を例に挙げ,日英方向の単語対応の例を図2.2に,英日方向の単語対応の例を図2.3に示す.ここで●は対応点を示す.

図: 日英方向の単語対応の例
\includegraphics[scale=0.5]{phrase_table_je.eps}

図: 日英方向の単語対応の例
\includegraphics[scale=0.5]{phrase_table_ej.eps}

次に,両方向の対応付けから,ヒューリスティックなルールにより,1対多の対応を認めた単語対応の計算を行う.ここで,ヒューリスティックとは人間の日々の意思決定に類似した直感的かつ発見的な思考方法である.基本のヒューリスティックとして``intersection"と``union",``grow"がある.さらに最終処理として``final"と``final-and"がある.

intersectionは日英方向と英日方向の両方向に単語対応が存在する場合,その単語対応を残す.unionは日英方向と英日方向のどちらか一方に単語対応が存在する場合,その単語対応を残す. intersectionの例を図2.4にunionの例を図2.5に示す.

図: intersectionの例
\includegraphics[scale=0.5]{phrase_table_intersection.eps}

図: unionの例
\includegraphics[scale=0.5]{phrase_table_union.eps}

growはintersectionの対応点の縦横方向にunionの対応点がある場合,その単語対応をintersectionに追加する方法である.さらに,縦横方向に加え,対角方向に存在するunionの対応点をintersectionに追加する方法としてgrow-diagがある.grow-diagの例を図2.6に示す.

図: grow-diagの例
\includegraphics[scale=0.5]{phrase_table_grow-diag.eps}

最終処理としてfinalとfinal-andがある.finalは少なくとも一方の言語の単語に単語対応がない場合,unionの単語対応を追加する.final-andは両言語の単語に単語対応がない場合,unionの単語対応を追加する方法である.

``grow-diag-final-and"はgrow-diagにおいて,両言語の単語に対応がない場合,unionの単語対応を追加する.grow-diag-final-andの例を図2.7に示す.

図: grow-diag-final-andの例
\includegraphics[scale=0.5]{phrase_table_grow-diag-final-and.eps}

単語対応のうち,矛盾しない全ての対訳句を抽出する.抽出した対訳句の例を表2.2に示す.


表: 抽出した対訳句の例
日本語句 英語句
は 犬 を treated his dog
彼 は 犬 を He treated his dog
優しく 世話 kindly
優しく 世話 し た kindly


next up previous contents
次へ: 言語モデル 上へ: 翻訳モデル 戻る: GIZA++   目次
平成27年3月13日