機械翻訳において“相対的意味論に基づく変換主導型統計機械翻訳(以下,TDSMT)”が提案されている[1].
TDSMTは,学習文対と変換テーブルを用いて,原言語文を入力とし,目的言語文を出力する手法である.
変換テーブルは“AがBならばCはD”で表現する. 日英翻訳の例では,Aは学習文対の日本語句,Bは学習文対の英語句,Cは入力文の日本語句,Dは出力文の英語句に当たる.対訳単語は対訳単語確率(IBM Model 1)を用いて作成する.次に,学習文対から単語レベル文パターンを作成する.さらに,新たな学習文対を用いて対訳句を選択する.最後に,順位を用いて枝刈りを行う.対訳句の順位付けは対訳単語確率によって行い,順位が低い対訳句を削除する.
しかしこの手法では,対訳単語確率は高いが誤っている対訳句が存在する.その結果,誤った変換テーブルが自動作成され,誤翻訳となる.
そこで本稿では,新たな変数確率
3#3を求めて対訳句の順位を決定し,順位が低い対訳句を削除する手法を提案する.この手法は,他の対訳句の対訳単語確率を利用する.提案手法によって,従来手法と比較して変換テーブルにおける対訳句の精度向上を目指す.
実験として,従来手法と提案手法の対訳句100個について精度調査を行った.
実験の結果,提案手法の対訳句の精度は従来手法の対訳句の精度と比較して同等だった.
本論文の構成は以下の通りである.第2章で従来の研究について説明し,第3章で提案手法について説明する.
第4章で実験データ,実験結果と評価を示す.第5章で本研究の考察を述べる.