本稿では,規模の異なる自由時制パターン辞書を対象パターン辞書とし,規模の
異なるパターン辞書ごとにを算出し,自由時制パターン辞書
の全パターン数の
と比較を行う.
それぞれの
の値を表8にまとめる.
その結果,80,000パターンのが
全パターン数の
に最も近い値となった.
ただし,小数点第1位の誤差を許せば,40,000パターンでも汎化の効果が予測でき
ると考えられる.100から20,000パターンでは,データが大幅に変動するので,値に
信頼性が持てない.
はパターン数が変動しても値が安定しているが,
5.2で述べたように,時制の汎化に関しては汎化の効果は予測ができない.
これより,規模の異なる被覆率調査で求めた実測値も汎化の効果の予測
ができる可能性があることがわかった.今後様々に考えられる汎化の方法の中で,効果の見込まれる汎化の方法の選別に有効である.