しかし,2000年の初めに「句に基づく統計翻訳[3]」が提案され, 「単語に基づく統計翻訳」と 比べて翻訳精度が高いことから,現在,機械翻訳において統計翻訳が主流となっ ている.2005年,「階層型統計翻訳[5]」が提案され,文法構造が 大きく異なる言語間での翻訳においての翻訳精度が期待されている.
2011年,後藤らの研究により様々な翻訳手法において翻訳結果の自動評価と人手評価が 行われた.その研究で,特許文を用いて階層型統計翻訳と句に基づく統計翻訳の 評価を行った.日本語-英語間の翻訳の自動評価は階層型統計翻訳が高く, 英語-日本語間の翻訳の人手評価は句に基づく統計翻訳が高くなった. しかし,階層型統計翻訳と句に基づく統計翻訳の性能の差を調査するための人手解析までは行われていない. 理由として解析が困難な特許文を使用している点が挙げられる.
そこで本研究では,比較的容易に解析可能な単文・重文複文を用いて翻訳を行い 翻訳結果の解析を行った.その結果,単文・重文複文において句に基づく統計翻訳より 階層型統計翻訳が自動評価と人手評価共に高いスコアが出た. この原因として,句に基づく統計翻訳は語の並びによって翻訳するのに対し, 階層型統計翻訳は階層的に翻訳を行うため,文の構造が考慮されているのではないかと考えた. よって,翻訳出力が,主語と述語が翻訳されているか調査した. その結果,句に基づく統計翻訳が12文,階層型統計翻訳は25文だった. 結果より,階層型統計翻訳が文の構造を考慮しているため,翻訳精度が高くなったと考えられる.
本論文の構成は以下の通りである.2章で統計翻訳システムの概要を説明する. 3章で評価方法について説明する.4章で実験について説明する. 5章で実験結果について説明する.6章で考察し7章でまとめる.