next up previous
次へ: 文音声認識実験の結果について 上へ: 考察 戻る: Ergodic HMMによる文法の自動獲得の可能性

学習データ量について


Ergodic HMMのパラメータの推定に必要な学習データ量の明確な基 準は知られていないが、少なくともHMMのパラメータ数と同程度以 上の学習データ量が必要であると思われる。今回の実験では、8状 態Ergodic HMMが持つパラメータ数は合計410752個あるのに対し、 学習データは57354単語であるため、十分な学習量とは言えない。 学習データ量に対する平均文生成確率の変化を見ても、学習データ の内容が前半と後半では異なっている問題があるが、これを裏づけ ていると思われる。今後、学習データ量を増やしたときの平均文生 成確率やエントロピーおよびHMMの定性的な構造の変化を検討する 必要がある。




Jin'ichi Murakami 平成13年10月5日