next up previous contents
次へ: 研究の背景 上へ: soturon_html 戻る: 表一覧   目次

はじめに

言語表現の構造を,意味を持つ単位にパターン化した文型パ ターンを用いた,パターン翻訳方式が提案されている[1].この方式 は,線形要素と非線形要素から成る文型パターンを用いることで,構造と 意味を一体的に扱うことが可能となり,良質な翻訳が期待されている.

パターン翻訳のために,文型パターン辞書が構築された[1]. 単文のパターンについては,約1.4万パターンが収録された日本語語彙大系が岩 波書店より出版されている.また,重文複文のパターンを約22万件収録した,日 本語表現意味辞書(重文複文編)が,2007年6月よりwebを通して公開された.

ところで,パターン辞書を用いて機械翻訳を行うには,入力文を日本語文型パター ンと照合するシステムおよび,照合結果と英語文型パターンより英文生成を行 うシステムが必要である.そのため, 入力文をパターンに照合するツールとしてパターン検索プログラムSPM[2] が,パターン照合結果と英語パターンから英文を生成するツールとしてパターン 翻訳システムITM[3]が作られた.

しかし,文型パターン辞書に収録されているパターンには誤りが含まれている. そのため,パターン検索やパターン翻訳において正しい結果が出力されない場合 がある. そこで,本研究では,パターンに含まれる誤りを修正し,パターン照合および 英文生成の精度の向上を目標とする. そのために,辞書に含まれる誤り箇所の検出と修正を行う.そして,修正前と修正後の 辞書を用いて,パターン照合実験とパターン翻訳実験を行い,修正の効果を確 認する.



平成20年6月20日