next up previous contents
Next: まとめ Up: 相対的意味論を利用した 変換主導型統計機械翻訳における未知語の出力 Previous: 翻訳に利用する確率値について   Contents


おわりに

I部では``相対的意味論に基づく変換主導型統計機械翻訳(以下,TDSMT)"を提案した.TDSMTでは,Mosesと同等程度の翻訳精度を示した.しかし,翻訳可能な入力文の割合(以下,カバー率)は20% 程度と低かった.TDSMTは翻訳の手順を詳しく追跡することが可能である.解析の結果,対訳文中に存在しない単語や対訳文中に出現頻度の少ない語(以下,未知語)が入力文中に存在した場合,その入力文は翻訳不可能となってしまう.このことが,TDSMTでカバー率の低い最も大きな原因だと考えられる.

そこで本実験では,TDSMTにおいて未知語を出力する手法を提案した.提案手法では,従来の変換テーブルに加え,入力文と対訳文から作成した未知語出力用変換テーブルを作成する.未知語出力用変換テーブルを加えた変換テーブルを利用し,翻訳を行うことで,出力文に未知語を出力することが可能となった.提案手法によりカバー率は60% 程度まで向上した.しかし,翻訳に利用される変換テーブルの数は10倍程度に増加した.そのため,従来手法と比較して,翻訳に必要な計算空間と計算時間は増加した.

さらに,提案手法と一般的な統計翻訳の手法であるmosesとの翻訳精度の比較を行った結果,未知語が正しく翻訳できた場合,提案手法は翻訳精度が高かった.今後,未知語を正しく翻訳する手法や新たな変換テーブルの作成手法を考案することで高い翻訳精度を持つ翻訳手法になる可能性が示された.



Hiroto Yasuba 2019-05-08