Next: 藤原らの手法の手順
Up: 先行研究
Previous: 日野らの手法の問題点
目次
藤原らは,句に基づく統計翻訳器(Moses)において,対訳学習文などの学習データを追加せずに行う未知語処理手法を提案した.Mosesではフレーズテーブルを参照して翻訳を行う.そして,フレーズテーブルを作成する際には``grow-diag-final-and"というヒューリスティックスを用いるのが一般的である.この``grow-diag-final-and"を用いて作成したフレーズテーブルの問題として,1単語対1単語の対訳データが作成されにくいことが挙げられる.そのため,1単語の翻訳を行う場合に未知語として出力されることがある.一方で,``intersection"というヒューリスティックスを用いてフレーズテーブルを作成した場合は,1単語対1単語の対訳データのみ作成される.そこで,藤原らは,``grow-diag-final-and"を用いて作成したフレーズテーブルと,``intersection"を用いて作成したフレーズテーブルの2種類を組み合わせたフレーズテーブルを用いて翻訳を行った.そして,未知語数の削減と翻訳精度向上が報告されている.
Subsections
s122019
2018-02-15