本稿では,規模の異なる自由時制パターン辞書を対象パターン辞書とし,規模の
異なるパターン辞書ごとにを算出し,自由時制パターン辞書
の全パターン数のと比較を行う.
それぞれのの値を表8にまとめる.
その結果,80,000パターンのが 全パターン数のに最も近い値となった. ただし,小数点第1位の誤差を許せば,40,000パターンでも汎化の効果が予測でき ると考えられる.100から20,000パターンでは,データが大幅に変動するので,値に 信頼性が持てない.はパターン数が変動しても値が安定しているが, 5.2で述べたように,時制の汎化に関しては汎化の効果は予測ができない.
これより,規模の異なる被覆率調査で求めた実測値も汎化の効果の予測 ができる可能性があることがわかった.今後様々に考えられる汎化の方法の中で,効果の見込まれる汎化の方法の選別に有効である.