単語に基づく統計翻訳の問題点

以下に, IBM翻訳モデルを用いて得た英日方向における単語対応の例と, 日英方向における単語対応の例を示す.また, ●は単語が対応した箇所を示す.


表: 英日方向の単語対応
  He went to kyoto on business
         
           
仕事          
         
京都          
           
行っ          
           


表: 日英方向の単語対応
  He went to kyoto on business
         
         
仕事          
         
京都          
       
行っ          
         

2.1は日本語単語 “は” と “に” と “た”に対応する英単語が存在しない.一方で, 表2.2は全ての単語に対して対応がとれている.単語に基づく統計翻訳は対応する単語が存在しない場合, 何も無い状態から単語の発生確率を計算する.このため単語翻訳確率の信頼性が問題となっている.よって現在句に基づく統計翻訳が行われている.