next up previous contents
Next: 謝辞 Up: 相対的意味論を利用した 変換主導型統計機械翻訳における未知語の出力 Previous: おわりに   Contents

まとめ

I部では,``相対的意味論に基づく変換主導型統計機械翻訳(以下,TDSMT)"を提案した.現在主流となっている翻訳手法では,翻訳精度が十分ではなく,また翻訳手順の解析が難しい.この問題を解決するために新しい翻訳手法として,TDSMTを提案した.TDSMTの学習である変換テーブルの自動作成手法により,約570万個の変換テーブルの作成に成功した.また,変換テーブルの精度は高かった.しかし,TDSMTの翻訳実験により,入力文に対する翻訳可能な入力文の割合(以下,カバー率)は20% 程度と低かった.TDSMTの翻訳精度をMosesと比較した.この結果,TDSMTは翻訳文の出力に成功した場合,Mosesと同等程度の翻訳精度をもつことがわかった.また,TDSMTは開発段階であり,手法の改善によりさらに,翻訳精度の高い翻訳手法になることが期待できる.

TDSMTは翻訳の手順を詳しく解析することが可能である.翻訳の手順を詳しく解析することによって,誤りの原因をしることができる.誤りの原因をふまえた改善法を提案することにより,効率の良い発展が期待できる.この発展性がTDSMTの利点である.

II部では,TDSMTにおいて,未知語を出力する手法を提案した.低いカバー率の原因は対訳文中に存在しない語や,対訳文中に出現する頻度が低く,学習が困難である語(未知語)が入力文中に出現した場合,翻訳不可能になってしまうことである.この問題を解決するために,未知語を出力文中に出力する手法を提案した.未知語出力用変換テーブルの自動作成手法を利用することにより,未知語出力用変換テーブルは大量に作成された.この結果,翻訳に利用する変換テーブルの数は10倍程度まで増加した.このため,提案手法は従来のTDSMTよりも多くの計算空間と計算時間を要する.しかし,未知語を出力することによって,カバー率は60% 程度まで増加した.

また,Mosesと翻訳精度の比較を行った.人手評価では,提案手法はmosesよりも翻訳精度が高い.これは,学習の難しい語を少ない情報から翻訳するよりも,未知語として出力することで,文法を維持した翻訳文を生成することができると考えられる.

本実験において,新しい手法である``相対的意味論に基づく変換主導型統計機械翻訳"を提案し,未知語を出力可能にして,カバー率と翻訳精度を向上させた.しかし,カバー率と翻訳精度はまだまだ低い.このため,出力文の解析と改善法の提案を行う必要がある.



Hiroto Yasuba 2019-05-08