next up previous contents
次へ: 翻訳システム 上へ: graduation 戻る: 表一覧   目次


はじめに

従来の機械翻訳は,人手で作成した文法規則の定義にしたがって翻訳を行う``ルールベース翻訳''であった. しかし,ルールベース翻訳システムの構築には,言語の専門家の知識を必要とし,膨大な開発コストがかかる. そのため,近年は,言語対から自動的に翻訳モデルを学習する``句に基づく統計翻訳''が主流となっている. 計算機の性能向上により,短時間での処理が可能になったため,様々な言語間での統計翻訳が研究されている. その一つとして,言語間の文法構造が類似しているイタリア-英語間において,句に基づく統計翻訳は翻訳精度が高いことが報告されている[3]. しかしながら,言語間の文法構造が大きく異なる日本語-英語間の翻訳においては,翻訳精度が低い.

そこで,現在,ハイブリッド翻訳が注目されている[4]. ハイブリッド翻訳は,まず入力文に対し,ルールベース翻訳を用いて目的言語の文法構造に近い文を出力する. 次に,その出力文に対し,句に基づく統計翻訳で目的言語へと翻訳する. 福田らは,ハイブリッド翻訳による日英翻訳は,句に基づく統計翻訳よりも翻訳精度が高いことを報告した[1].

一方,Chiangが階層型統計翻訳を提案した[5]. 階層型統計翻訳は文脈自由文法をモデルとして翻訳を行うため,正しい文法構造を持った文に翻訳される傾向がある. 久保田らは日英翻訳において,階層型統計翻訳と句に基づく統計翻訳を比較した. その結果,自動評価,人手評価ともに階層型統計翻訳の翻訳精度が高いことを報告した[2].

そこで,本研究では,ルールベース翻訳と階層型統計翻訳を組み合わせて日英翻訳を行い,翻訳精度の向上を試みた. その結果,提案手法は従来のハイブリッド翻訳と翻訳精度の差がなかった. 原因として,ルールベース翻訳の文法構造変換が優れているため, 階層型統計翻訳が文法構造を考慮する必要がなかったことが考えられる. また,提案手法や従来のハイブリッド翻訳の翻訳精度は,ルールベース翻訳単体よりも劣っていた. よって,より翻訳精度の高いハイブリッド手法の検討が必要である.

本論文の構成は以下の通りである. 第2章において,各翻訳システムについての説明を行う. 第3章において,評価手法についての説明を行う. 第4章において,提案手法の手順についての説明を行う. 第5章において,実験環境についての説明を行う. 第6章において,自動評価と人手評価の結果を示す. 第7章において,本研究の考察を述べる. 第8章において,実験で使用した各手法の比較を行う. 第9章において,結論を述べる.



平成25年2月13日