next up previous
次へ: (2)入力文1文に適合する文型パターン数 上へ: 外国人用日本語例文に対する被覆率 戻る: 外国人用日本語例文に対する被覆率

(1)被覆率特性

被覆率実験の結果を表9に示す.この結果を4.1節の(1)の結果(表5,表7:「母集団試験文」の場合)と比較すると以下のことが分かる.

(1)
「外国人向け試験文」では,単語レベル,句レベル,節レベルの「文型再現率$R1$」と「文型一致率$R2$」が共に4〜17%低下しており,低下の割合は,単語レベルが最も大きい.
(2)
「完全一致」の割合は,3レベルとも10%〜30%の範囲で低下している.相対値で見ると,単語レベルの低下は著しく,約1/3となっている.
(3)
しかし,「部分一致」の割合は,7〜24%向上しており,「完全一致率」の低下が大きいものほど,「部分一致」の増加する割合が大きい.


1.5
表 9: 「外国人用試験文」に対する被覆率
文型パターン 文型再現率($R1$ 文型一致率
のレベル 完全一致 部分一致 合計 ($R2$)
単語レベル  4.9 % 48.1 % 52.9 % 30.0 %
句レベル 24.7 % 58.2 % 82.9 % 64.5 %
節レベル 22.2 % 52.2 % 74.4 % 54.8 %
混合レベル 28.5 % 57.3 % 85.8 % 67.7 %

このうち,(1)で単語レベルの値が最も大きく低下するのは,このレベルの文型パターンは元となった標本文の母集団の個別的な特徴の多くを引きずっているのに対して,句レベル,節レベルでは,かなり一般化した文型パターンとなっていることを意味する.これは,単語レベルの完全一致率が大きく低下していること,また,文型パターン数が約1/10の節レベルの文型パターンで$R1$$R2$共にあまり低下しないことからも裏付けられる.

また,(2)と(3)で見られるように,「完全一致」する文型が減少することも,テスト文の母集団の違いが現れたものと思われる.「外国人向け日本文」では,外国人の苦手な日本語表現が多く含まれることが考えられるが,そのような表現こそ機械翻訳でも苦手な表現だと推定されるから,今後そのような表現を拾い出して文型パターン化することも大切だと考えられる.



平成16年11月17日