機械翻訳において様々な手法が提案されている.
しかし,それらの手法で得られる出力が異なる場合が多い.
そこで,異なる機械翻訳手法によって得られた複数の出力(候補文)から,最尤の出力を選択する手法である“相対的意味論に基づく統計機械翻訳(RSMT)”が提案されている.
この手法を用いることで,各手法の出力から最尤の出力を得られる.
RSMTでは出力を選択するために,学習文対の日本語側(A),学習文対の英語側(B),入力文(C),候補文(D)について文類似度及び文翻訳確率を計算する.
文類似度は同一言語の文章(AとCまたは,BとD)がどれだけ類似しているかを示す.
文翻訳確率はCがDに翻訳される確率を示す.
さらに,文類似度及び文翻訳確率には様々な計算方法が存在する.
本稿の目的は,RSMTで用いる文翻訳確率の計算方法として最適な方法を調査することである.
5つの文翻訳確率の計算方法を用いてRSMTを動作させ結果を比較する.
この実験によって,最適な文翻訳確率の計算方法を調査する.
実験として,1000文を入力とした自動評価による翻訳精度の調査を行った.
また,100文を入力とした人手評価を行った.
実験の結果,RSMTに最適な翻訳確率の計算方法は,自己相互情報量(PMI : Pointwise Mutual Information)[11]と結論づけた.
本論文の構成は以下の通りである.第2章で従来の研究について説明する.また,第3章でRSMTについて説明し,第4章で用いる文翻訳確率について説明する.
第5章でOpen-NMTの第1候補を候補文に用いた実験の,実験データ,実験結果と評価を示す.
さらに,第6章でOpen-NMTの第8候補を候補文に用いた実験の,実験データ,実験結果と評価を示す.
そして,実験のまとめを第7章に示す.
第8章で本研究の考察を述べる.