機械翻訳において“相対的意味論に基づく変換主導型統計機械翻訳(以下,TDSMT)”が提案されている[1].
TDSMTは,学習文対と変換テーブルを用いて,原言語文を入力とし,目的言語文を出力する手法である.
変換テーブルは“AがBならばCはD”で表現する.
しかしこの手法で出力文を得るためには,変換テーブルを適用した,入力文が学習文対に完全に一致する必要がある.
従って,入力文数に対して,得られる出力文数が少ないという問題がある.
そこで本稿では,“相対的意味論に基づく変換主導統型パターン統計機械翻訳(以下,TDPBSMT)”を提案する.
この手法は,変換テーブルを“AがB” と “CがD” の2つに分割する.
次に,“AがB”を利用して文パターンを作成する.そして,“CがD”を文パターンに適用する.
提案手法によって,従来手法と比較して出力文数が向上する.
実験として,500文を入力としたカバー率(出力文数/入力文数)の調査を行った.
また,翻訳精度の調査として,100文の対比較調査を行った.
実験の結果,提案手法のカバー率は従来手法と比較して向上した.また,翻訳精度は差がなかった.
本論文の構成は以下の通りである.第2章で従来の研究について説明し,第3章でTDPBSMTについて説明する.
第4章で実験データ,実験結果と評価を示す.第5章で本研究の考察を述べる.