next up previous contents
次へ: 先行研究 上へ: syuron 戻る: 表一覧   目次

はじめに

従来の代表的な機械翻訳として,トランスファー方式による翻訳が行われている.ト ランスファー方式による翻訳は,構文構造を変換する構文処理と,要素を翻訳す る意味処理を行う.そして,それらの結果を合成することによって翻訳を行う. このような従来の自然言語処理方法を要素合成法と呼ぶ.要素合成法は,言語 表現の意味は線形であると仮定し,表現全体の意味を部分的な意味の合成で説 明する.しかし,この方法では,元の意味が再現されないという問題があった. この問題に対して,表現全体の意味をすくい取るための仕組が必要であるとし, 構造と意味を一体化したパターン翻訳の研究が行われた.池原らは ,単文のための文型パターン辞書として,「日本語語 彙大系」[1]を作成した.また,重文・複文のための文型パターン辞 書として,「鳥バンク」[2]を作成した.
石上らは,鳥バンクを用いた日英パターン翻訳実験を行った[3]. 単語に対応する変数部分には,辞書引きをして翻訳を行ったが,句に対 応する変数部分には,ルールを作成して翻訳を行う必要があった.しかし,このルールをす べて作成するのは困難である.
一方,近年では,統計翻訳[4]が注目され,研究が行われて いる.統計翻訳は,原言語と目的言語のコーパスから自動的に翻訳規則を作成して,翻 訳を行う手法である.したがって,統計翻訳は,システムの開発が容易である.
そこで本研究では,日英パターン翻訳における変数部分の翻訳の問題を 解決するために,統計翻訳を用いることを提案する.今回の実験では, 鳥バンクの重文・複文の文型パターン辞書を用いて,日本語を中間言語に変換す る.作られた中間言語を用いて統計翻訳を行い,翻訳精度を調査する.

平成24年3月30日