next up previous contents
次へ: 目次 上へ: soturon 戻る: soturon   目次

概要

現在,機械翻訳において,対訳データから自動的に翻訳規則を獲得し,翻訳を行 う統計翻訳が注目されている.統計翻訳では,単語の列から単語の列への翻訳を 確率的に行うために,フレーズテーブルを用いる.フレーズテーブルはプログラ ムにより自動作成される.そのため,フレーズ対のカバー率は高いが,信頼性は 低い.

一方,人手で作成されるフレーズ対は信頼性は高いが,フレーズ対の総数が少な いため,カバー率は低い.先行研究で,プログラムで自動作成さ れたフレーズテーブルに,人手で作成したフレーズ対を追加し,翻訳精度の向上 が確認された.しかし,先行研究では,人手で作成したフレーズ 対の総数が少ないため,フレーズテーブルの増加量が少ない.

そこで,本研究では,翻訳対の総数が多い``英辞郎''を利用し, フレーズテーブルの増加量を多くすることにより,翻訳精度の向上を試みた.そ の結果,BLEU値が単文では0.3%,重文複文では0.2%向上した.結果から,``英 辞郎''で作成した翻訳対を追加した提案手法は有効であることが示された.



平成22年2月13日