そこで,単語レベルの文型パターンとの照合において,入力日本文に対して,「完全一致」する文型パターンが存在した割合と「部分一致」する文型パターンしか存在しなかった割合を調べた.その結果を表7に示す.
表中の「完全一致」の欄は,入力文の中で,「完全一致」した文型パターンがひとつ以上あった文の割合を示し,「部分一致」の欄は,「部分一致」した文型パターンしか存在しない入力文の割合を示す.「文型再現率」は,「完全一致」した文型パターン又は「部分一致」した文型パターンのいずれかを持つ入力文の割合であるので,両者の合計に一致する.
この表から以下のことが分かる.
これらは,各文型パターンの性質をよく表していると思われる. まず,単語レベルの文型パターンに比べて句レベルの文型パターンの「完全一致」が多いのは,以下の理由によると考えられる. すなわち,句レベルの句変数には元の標本文中の句を変数化しただけでなく,単語変数の適用範囲を句レベルに拡大したものなどがあり, 入力文の中に元の標本文にはないような名詞修飾や格要素が入力文にあっても,それらは名詞句,動詞句などの一部として解釈されるためである. これに対して節レベルの文型パターンの「完全一致率」がそれほど高くないのは,文型パターン数そのものが少ないためと考えられる.
なお,節レベルの文型パターン数が少ないのは,節レベルで文型パターン化できない標本文が多かったためであるが,これは,多くの文が節レベルでは非線形であり,複数の節に分離して翻訳してその結果を合成するような要素合成法の方法では良い翻訳ができないことを意味している.また,(4)にあるように混合レベルの被覆率は句レベルと大差ないこと,節レベルの文型パターンでは,高品質の翻訳は期待しにくいことから,節レベルの文型パターンには余り期待しない方が良さそうである.