next up previous contents
Next: 従来手法:相対的意味論を利用した変換主導型統計機械翻訳(TDSMT) Up: 相対的意味論を利用した 変換主導型統計機械翻訳における未知語の出力 Previous: 相対的意味論を利用した 変換主導型統計機械翻訳における未知語の出力   Contents

はじめに

現在,機械翻訳の分野では統計翻訳やニューラル機械翻訳など様々な手法が研究されている.しかし,どの手法も十分な翻訳精度にたどり着いていない.そこで第I部では``相対的意味論を利用した変換主導型統計機械翻訳[1](以下,TDSMT)"を提案した.

TDSMTは対訳文と「A(日本語単語)がB(英語単語)ならばC(日本語句)はD(英語句)」で表現する変換テーブルを利用する.学習として,対訳文から変換テーブルの自動作成を行う.その後,対訳文と変換テーブルを利用して,翻訳を行う.TDSMTは入力文の変換によって出力文を作成するため,文法性の高い翻訳が期待できる.第I部の実験では,変換テーブルが大量に作成され,その精度も高かった.しかし,翻訳可能な入力文の割合(以下,カバー率)は約20% 程度と低かった.カバー率が低い原因として,対訳文中に存在しない語や,対訳文中の頻度が低く学習が難しい語(以下,未知語)が入力文中に一つでも存在すれば,翻訳不可能になることが挙げられる.また,TDSMTは翻訳文の出力に成功した場合Mosesと同等の翻訳精度がある.

そこで,第II部では,TDSMTにおいて,出力文に未知語を出力する手法を提案する.未知語を出力するために未知語出力用変換テーブルを作成し,変換テーブルに追加する.未知語出力用変換テーブルは「A(日本語単語)がB(英語単語)ならばC(日本語句)はC(日本語句)」で表現される.また未知語出力用変換テーブルは入力文と対訳文から作成する.

この論文の第6章では,従来手法である``相対的意味論に基づく変換主導型統計機械翻訳[1]"を紹介する.第6章では,提案手法である``未知語を出力可能にしたTDSMT[1]"の手順を説明する.第6章では,実験データやどのような評価を行ったかを示す.第6章では,第6章で示した評価の結果を示す.第6章では,提案手法の利点や誤りの解析を紹介する.第7章で,この研究全体をまとめる.



Hiroto Yasuba 2019-05-08