近年,文法構造が大きく異なる言語間での翻訳において階層型統計翻訳が注目されている.
先行研究として,後藤ら[1]は特許文を用いて階層型統計翻訳と, 句に基づく統計翻訳の自動評価・人手評価のスコア比較を行った.
その研究において,日英間の翻訳は階層型統計翻訳の人手評価が高く,英日間の翻訳は 句に基づく統計翻訳の自動評価が高い結果となった.しかし,特許情報文は文の構造が 複雑なため,翻訳結果の解析まで行われていない.
そこで,本論文では日本語-英語翻訳において,特許情報文と比べ比較的に人手評価の容易な, 単文と重文複文を用いて,階層型統計翻訳と句に基づく統計機械翻訳の自動評価と人手評価を行った. その結果,階層型統計翻訳が両者の評価で高い結果となった. この原因として,階層型統計翻訳は階層を用いているので,文の構造が考慮されているが, 句に基づく統計翻訳は句の並び替えによって,翻訳を行うので文の構造が考慮されていないことが考えられる.
そこで両者の評価結果から,翻訳方法の違いに着目し,主語と述語が翻訳されている文について再度人手調査を行った. 調査の結果,階層型統計翻訳は25文,句に基づく統計翻訳は12文と句に基づく統計翻訳より階層型統計翻訳の文数が13文多い結果となった. この調査の結果,階層型統計翻訳は文の構造が考慮されることで翻訳評価が高くなったと考えられる.