next up previous contents
Next: パターン翻訳 Up: honron Previous: 表目次   目次

はじめに

パターン翻訳[1]は, 入力された原言語文に対し, フレーズ辞書と文パターン辞書を利用して翻訳文を出力する方法である. しかし, フレーズ辞書と文パターン辞書は人手で作成するため, 開発にコストがかかる.

開発コストを削減するため, 江木は, フレーズ辞書と文パターン辞書を自動作成するPattern Based SMT[2](以下, 全自動手法)を提案した. しかし, 翻訳精度はまだ低い. そこで, 坂東は, 翻訳精度の向上のために人手作成されたフレーズ辞書を用いたPattern Based SMT[3](以下, 半自動手法)を提案した. その結果, 半自動手法は翻訳精度の高い文が出力されるようになった. しかし, 翻訳文全体で見ると翻訳精度が低くなった.

この原因は, 人手作成したフレーズ辞書は自動作成したフレーズ辞書よりもフレーズの数が少ないため, 文パターンの数が少なくなる. そのため, 未知語を含む文が多く出力されたことが考えられる.

そこで, 本研究では, 文パターンの数を増やすことで翻訳文全体の翻訳精度の向上を目指す. その方法として, 半自動手法で得られたフレーズ辞書と, 全自動手法で得られた文パターン辞書を用いる.

本研究では日英方向のパターン翻訳を行う. フレーズ辞書と, 文パターン辞書を用いて得られた英語翻訳文に対して,言語翻訳確率(tri-gram)を用いた絞込みを行い,出力する英語翻訳文を決定する.その後, 対比較実験により, 半自動手法, 全自動手法とそれぞれ100文ずつ出力された英語翻訳文を人手評価によってどちらが優れているかを判断し, 提案手法の有効性を調査する.

本論文の構成は以下の通りである. 第2章で従来のパターン翻訳システムについて説明し, 第3章で統計翻訳システムについて説明する. 第4章で全自動手法の説明, 第5章で半自動手法の説明をして, 第6章で提案する翻訳システムについて説明する. 第7章で実験条件を述べ, 第8章で実験結果を示す. 第9章で本研究の考察を述べる.



s122053 2016-03-04