next up previous contents
次へ: 目次 上へ: honron_kanazawa6 戻る: honron_kanazawa6   目次

概要

日英機械翻訳において,文型パターンを用いて翻訳する方法がある.その中でも、 等価的類推思考の原理に基づく機械 翻訳方式では,翻訳対象となる日英両言語で言語表現を「文型パターン」によっ て記述しておき,意味的に等価な文型パターンを対応付けることで,意味の失わ れない解析・生成を実現しようとしている.

文型パターンは,「字面」,「変数」,「関数」,および,「記号」で構成され る.文型パターンは,意味的等価性を保ち訳出に有効であるために,文の構造を支え る単語は,「字面」,「変数」あるいは「関数」に置き換えられる.逆にそうで ないものは,パターンの構成要素にならない.そして,パターンマッチングによ り入力文の解析を行うものである.文型パターンの汎用性を高めるためには,異 なる時制・相・様相への適合や,日本語に顕著な語順の自由度を高める等の,記 述要素の効果的な汎化が課題となっている.

そこで,本稿では,日本語パターンにおける「パターンに時制・相・様相の情報を与える関数」,お よび,「要素の位置変更可能の指定」についての効果を評価パラメータを用いて, 汎化の効果について,定量的に評価する.

具体的な方法は,次の通りである.まず,文型パターン辞書に収録されている文法・単語レ ベルの文型パターン辞書(122,619パターン)を「基準パターン辞書」とする.そ して,基準パターン辞書に対して「時制・相・様相関数の汎化」,および,「位置変更可能記号の 無効化」を行い,それぞれに対し新たなパターン辞書を作成する.これを「対象パター ン辞書」とする.次に,入力文として123,016文と基準パターン辞書,および,対象パターン辞書を文型パターンパーサを 用いて照合を行う. そして,照合結果から,評価パラメータとして「文型パターン拡大率${\eta }$」(対 象パターン辞書の規模が基準パターン辞書の規模に換算して,何倍に相当するか)を用い て文型パターン辞書の汎化及び無効化の効果を定量的に評価し,汎化の効果を確認する.

評価の結果,基準パターン辞書と比べ時制を汎化すると1.36〜1.53倍,相・様相を汎化すると 1.40〜1.49倍,位置変更可能記号を有効化すると無効化した場合に比べ1.02〜 1.05倍規模のパターン辞書が作成でき,「時制・相・様相を表す 関数」,および,「要素の位置変更可能の指定」をすることは,パターンの汎用 性を向上するために有効だとわかった.



平成17年3月22日