next up previous contents
次へ: 言語モデル 上へ: 句に基づく統計翻訳 戻る: GIZA++   目次

フレーズテーブルの作成

GIZA++よりIBM翻訳モデルを推定することで最尤な単語対応を得る.これを日英,英日の両方向に対して行う.日本語文``私は海を見に行く''とその対訳英語文``I go to see the sea''を例に挙げ,日英方向の単語対応の例を表2.2に,英日方向の単語対応の例を表2.3に示す.また,●は単語が対応した箇所を示す.


表: 日英方向の単語対応の例
  I go to see the sea
         
         
         
         
         
         
行く          


表: 英日方向の単語対応の例
  I go to see the sea
         
           
         
         
     
           
行く            

次に,両方向の対応付けからヒューリスティックスなルールにより,1対多の対応を認めた単語対応の計算を行う.ここで,ヒューリスティックとは人間の日々の意思決定類似した直感的かつ発見的な思考方法である.基本のヒューリスティックとして``intersection''と``union''がある.intersectionは,日英方向と英日方向の両方向に単語対応が存在する場合にその単語対応を残す.unionは日英方向と英日方向のどちらか一方に単語対応が存在する場合にその単語対応を残す.intersectionの例を表2.4に,unionの例を表2.5に示す.


表: intersectionの例
  I go to see the sea
         
           
         
           
         
           
行く            


表: unionの例
  I go to see the sea
         
         
         
       
     
         
行く          

またintersectionとunionの中間のヒューリスティックスとして``grow''と``grow-diag''がある.これら2つのヒューリスティックスではintersectionの単語対応とunionの単語対応を用いる.growは縦横方向,grow-diagは縦横対角方向に,intersectionの単語対応からunionの単語対応が存在する場合にその単語対応も用いる.growの例を表2.6に,grow-diagの例を表2.7に示す.


表: growの例
  I go to see the sea
         
           
         
         
         
           
行く            


表: grow-diagの例
  I go to see the sea
         
           
         
       
       
         
行く            

grow-diagの最終処理として``final''と``final-and''がある.finalは少なくとも一方の言語に対応がない場合に,unionの単語対応を追加し,final-andは両言語単語に対応がない場合に,unionの単語対応を追加する方法である.grow-diag-finalの例を表2.8に,grow-diag-final-andの例を表2.9に示す.


表: grow-diag-finalの例
  I go to see the sea
         
         
         
       
     
         
行く          


表: grow-diag-final-andの例
  I go to see the sea
         
           
         
       
     
         
行く            

得られた単語対応うち,矛盾しない全ての対訳句を得る.このとき,対訳句に対して翻訳確率を計算し,対訳句に確率値を付与することでフレーズテーブルを作成する.


next up previous contents
次へ: 言語モデル 上へ: 句に基づく統計翻訳 戻る: GIZA++   目次
s122025 平成28年3月21日