next up previous contents
次へ: 目次 上へ: syuron_hmaeta 戻る: syuron_hmaeta   目次

概要

近年,日英機械翻訳方式として,文型パターンを用いて翻訳を行うパターン翻訳 が注目されている.パターン翻訳は,日本語の入力文に合った日本語パターンを 文型パターンデータベースから検索し,検索した日本語パターンに対応する英語 パターンを用いて出力英文を生成する翻訳方式である.パターン翻訳を行う際, 大量の文型パターンを用意する必要がある.過去の研究では,パターン作成にお ける変数化の問題などがあり,意味的に独立したパターンを大量に作成する事が 困難であった.これに対して[1]で提案した方法により,大量の パターンを作る事が可能になった.現在,日本語の重複文12万文に対してパター ンが作成されている.また, 池原等[2]により,日本語入力文12万文に対し て60%以上の適合率が示されている. しかし, 入力文の翻訳に使用できない文型 パターンが正解パターンと共に多く抽出されてしまい, 正解率が下がってしまう 問題がある.

そこで本研究では, 用言意味属性を使用してパターンの絞り込みを行い, 使用す る用言意味属性の条件の違いによる適合率および正解率の変化を調査した.

具体的な調査方法として,まず文型パターンパーサを利用して文型パターンを 抽出する. 次に, 抽出された文型パターンの日本語パターンを用言意味属性を用 いてパターンの絞り込みを行う. そして, 残ったパターンに対して人手で評価を 行う. 最後に適合率および正解率を算出する.

調査の結果,入力文110文中, 実験1(jpp_20040816, 3LevelPattern_ver5.3.1)で は38文, 実験2(jpp_20050627, 3LevelPattern_ver9.0.0)では62文が1つ 以上の日本語パターンの候補を抽出できた.次に, 用言意味属性を用いたパター ンの絞り込みを行った後, 正解率を算出した所, 実験1では用言意味属性を使用 しない場合の正解率は12%, 用言意味属性(IK第1分類)を使用し た場合の正解率は17%であった. また, 実験2では用言意味属性を使用しない場 合の正解率は14%, 用言意味属性(IK第1分類)を使用した場合の 正解率は18%であった.

よって,本研究ではIKを用いた文型パターンの絞り込みによって, 正解率が向上した事を確認した.



平成18年3月24日