next up previous contents
Next: intersection Up: 日英統計翻訳 Previous: GIZA++   目次


フレーズテーブル作成法

フレーズテーブルの作成では,単語対応をとったあとに,ヒューリスティックなルールによって句の対応をとる.句レベルであるフレーズテーブルを得るには,まず,GIZA++を用いて,学習文から日英方向と英日方向の対訳文において最尤な単語アライメントを得る.例として,日本語文``風で火が消えた"と,その対訳英語文``The wind blew out the fire"を挙げる.図2.2に日英方向の単語対応を示す.また,図2.3に英日方向の単語対応を示す.なお,図2.2と図2.3において,●は対応点を示す.

図 2.2: 日英方向の単語対応
\includegraphics[width=70mm]{jp-en.eps}

図 2.3: 英日方向の単語対応
\includegraphics[width=70mm]{en-jp.eps}

次に,両方向のアライメントから,両方向に1対多の対応を認めた単語アライメントをヒューリスティックスなルールにより計算する. 基本的なヒューリスティックスとして,``intersection",``union",``grow",そして``grow-diag"がある.



Subsections

s122019 2018-02-15