next up previous contents
Next: 目次 Up: honron Previous: honron   目次

概要

パターン翻訳は, 入力された原言語文に対し, フレーズ辞書と文パターン辞書を利用して翻訳文を出力する方法である. パターン翻訳は, 入力文が適切な文パターンに適合した場合, 翻訳精度の高い文を出力する傾向にある. しかし, フレーズと文パターンを人手作成するために, 開発にコストがかかる.

開発コストを削減するため, 江木は, フレーズ辞書と文パターン辞書を自動作成する, Pattern Based SMT(以下, 全自動手法)を提案した. 全自動手法は, 統計的手法を用いて, フレーズ辞書と文パターンを自動作成して翻訳を行う. そのため, 人手作成よりも, 開発の時間とコストが低くなった. しかし, 翻訳精度はまだ低い.

そこで, 坂東は, 翻訳精度の向上のために, 人手作成されたフレーズ辞書を用いたPattern Based SMT(以下, 半自動手法)を提案した. その結果, 半自動手法は, 翻訳精度の高い文が出力されるようになった. しかし, 翻訳精度の低い文も出力されるようになり, 翻訳文全体で見ると翻訳精度が低くなった. この原因は, 人手作成したフレーズ辞書は, 自動作成したフレーズ辞書よりも文パターンになるフレーズの数が少ないので, 文パターンの数が少なくなる. そのため, 未知語を含む文が多く出力されたと考えられる.

本研究では, 文パターンの数を増やすことで, 翻訳文全体の翻訳精度の向上を目指した. その方法として, 半自動手法で得られたフレーズ辞書と全自動手法で得られた文パターン辞書を用いて, パターンに基づく統計翻訳を行い, 翻訳精度の調査を行った. また, 全自動手法, 半自動手法とそれぞれ対比較評価を行った

対比較評価の結果, 提案手法と半自動手法の翻訳精度に大きな差がないことがわかった. しかし, 提案手法と全自動手法との比較では, 提案手法の方が全自動手法よりも翻訳精度が優れていた. よって, 人手作成したフレーズ辞書の有効性を示せた.



s122053 2016-03-04