現在,機械翻訳の分野において,対訳文対から自動的に翻訳規則を生成し翻訳を行う統計翻訳が注目され,研究が盛んに行われている.統計翻訳では英語-イタリア語など文法構造が類似する言語対において翻訳精度が高くなり,日本語-英語などの文法構造が異なる言語対においては翻訳精度が低くなる傾向がある.別の翻訳手法にパターン翻訳がある.パターン翻訳では文パターン辞書と単語辞書を用いて翻訳を行う.文パターンが有する大局的な文法情報を用いることで翻訳文全体の構造を保持した翻訳精度の高い翻訳文を生成できる利点がある.しかし,従来,文パターン辞書の作成は人手で行うため,開発にコストがかかる欠点がある.
そこで本研究では,文パターン辞書を対訳文対から自動的に作成する手法を検討する.文パターン辞書の自動作成により,開発にかかるコストの削減が可能となる.また,パターン翻訳を統計翻訳の前処理に用いることで,日本語の文法構造を英語に類似し翻訳精度が向上すると考えられる.
従来の日英統計翻訳をベースラインとして,ベースラインと提案手法の翻訳精度の調査を行い,結果を比較する.実験は,単文を用いた翻訳実験と,重文複文を用いた翻訳実験の2種類を行う.評価方法には自動評価法と人手による対比較評価を行う.自動評価法にはBLEU,NIST,METEORの3種類を用いる.人手による対比較評価については,提案手法の翻訳結果がベースラインの翻訳結果よりも優れていた場合,提案手法の翻訳結果がベースラインの翻訳結果よりも劣っていた場合,どちらの翻訳結果も文質に差がなかった場合,同一出力であった場合の4つの基準で評価を行う.
実験の結果,単文の実験で,提案手法はベースラインと比較して,自動評価でBLEU値が0.29%,NIST値が0.008低下した.METEOR値は0.15%向上した.人手による対比較評価では,提案手法の翻訳結果がベースラインの翻訳結果よりも優れていた文が30文であり,反対に劣っていた文では9文であった.また,重文複文の実験では,提案手法はベースラインと比較して自動評価でBLEU値が0.3%,NIST値が0.0526,METEOR値が0.0.28%と全ての評価基準で向上した.また対比較評価においても,提案手法の翻訳結果がベースラインの翻訳結果よりも優れていた文が33文であり,反対に劣っていた文では3文であった.
以上の結果から,単文では,自動評価法において提案手法はベースラインと比較して性能に差がない結果となっている,しかし,対比較評価においては,ベースラインよりも優れていた文が明らかに多い.また,重文複文では,自動評価法と対比較評価のどちらにおいても提案手法はベースラインよりも優れた結果となっている.したがって,本研究の提案手法の有効性が確認できた.