next up previous
次へ: (2)適合文型パターン数 上へ: 適合の仕方と適合文型パターン数 戻る: 適合の仕方と適合文型パターン数

(1)「完全一致」と「部分一致」の割合

すでに,3.2節で述べたように,入力文と文型パターン辞書との照合では, 適合した文型パターンとして「完全一致」した文型パターンと「部分一致」した文型パターンが抽出される. 前者の場合,入力文の全要素が適合した文型パターンを使用して翻訳されるが, 後者の場合は,入力文要素の中に文型パターンに定義されない要素が含まれているため, それらの要素は文型パターンとは別の方法で翻訳して目的言語に組み込まなければならない. そのため,入力文に対していずれの形で適合したかが問題となる.

そこで,単語レベルの文型パターンとの照合において,入力日本文に対して,「完全一致」する文型パターンが存在した割合と「部分一致」する文型パターンしか存在しなかった割合を調べた.その結果を表7に示す.


1.5
表 7: 「完全一致」と「部分一致」の割合
レベル 完全一致 部分一致 合計(文型再現率$R1$
単語レベル 15.0 % 54.8 % 69.8 %
句レベル 54.3 % 34.6 % 89.0 %
節レベル 39.5 % 38.6% 78.1 %
混合レベル 56.2 % 35.6 % 91.8 %

表中の「完全一致」の欄は,入力文の中で,「完全一致」した文型パターンがひとつ以上あった文の割合を示し,「部分一致」の欄は,「部分一致」した文型パターンしか存在しない入力文の割合を示す.「文型再現率$R1$」は,「完全一致」した文型パターン又は「部分一致」した文型パターンのいずれかを持つ入力文の割合であるので,両者の合計に一致する.

この表から以下のことが分かる.

(1)
単語レベルの文型パターンでは,「完全一致」に比べて「部分一致」となる割合は4倍近い.
(2)
これに対して,句レベルの文型パターンでは,この関係が逆転しており,「完全一致」の割合は1.5倍である.
(3)
節レベルの文型パターンでは,「完全一致」と「部分一致」の割合が拮抗している.
(4)
また,混合レベルは句レベルに近い値である.

これらは,各文型パターンの性質をよく表していると思われる. まず,単語レベルの文型パターンに比べて句レベルの文型パターンの「完全一致」が多いのは,以下の理由によると考えられる. すなわち,句レベルの句変数には元の標本文中の句を変数化しただけでなく,単語変数の適用範囲を句レベルに拡大したものなどがあり, 入力文の中に元の標本文にはないような名詞修飾や格要素が入力文にあっても,それらは名詞句,動詞句などの一部として解釈されるためである. これに対して節レベルの文型パターンの「完全一致率」がそれほど高くないのは,文型パターン数そのものが少ないためと考えられる.

なお,節レベルの文型パターン数が少ないのは,節レベルで文型パターン化できない標本文が多かったためであるが,これは,多くの文が節レベルでは非線形であり,複数の節に分離して翻訳してその結果を合成するような要素合成法の方法では良い翻訳ができないことを意味している.また,(4)にあるように混合レベルの被覆率は句レベルと大差ないこと,節レベルの文型パターンでは,高品質の翻訳は期待しにくいことから,節レベルの文型パターンには余り期待しない方が良さそうである.



平成16年11月17日