相対的意味論に基づく変換主導統計機械翻訳(TDSMT)[1]

“相対的意味論に基づく変換主導型統計機械翻訳(TDSMT)”とは,安場らが提案した機械翻訳の手法の一種である. TDSMTは,学習文対と,変換テーブルを用いて,原言語文を入力とし,目的言語文を出力する. 変換テーブルは“ABならばCD”で表現する. Aは学習文対中の原言語句,Bは学習文対中の目的言語句,Cは入力文中の原言語句,Dは出力文中の目的言語句である.
 原言語入力文が,学習文対の原言語側と一致するまで,入力文と変換テーブル中のACを照合する. 次に,一致した学習文対の目的言語側を,照合した変換テーブルのBDに従って変換し,目的言語翻訳文を出力する.
 まず,対訳単語を対訳単語確率(IBM Model 1)を用いて作成する.次に,学習文対から単語レベル文パターンを作成する.さらに,新たな学習文対を用いて対訳句を選択する.最後に,順位を用いて枝刈りを行う.対訳句を順位付けは対訳単語確率によって行い,順位が低い対訳句を削除する.しかし,問題点として,対訳単語確率は高いが誤っている対訳句が存在する.その結果,誤った変換テーブルが自動作成され,誤翻訳となる.



Subsections