次へ: Ergodic HMMの定性的特徴
上へ: Ergodic HMMによる言語のモデル化
戻る: 言語データ
前節で作成した対話データodd4000を学習データとし、状態数の異なる
4種類の状態遷移出力型Ergodic HMM (2状態、4状態、8状態、16状態)
でモデル化の実験を行なった。Baum-Welch algorithmの学習終了条件
として、シンボル系列を生成する確率の上昇率がある一定値以下に
なった場合に学習を終了させる方式を採用した。実験の条件を表
2 にまとめた。
表 2:
言語モデル生成実験の条件
HMMの構造 |
状態遷移出力型Ergodic HMM |
HMMの状態数 |
2状態,4状態,8状態,16状態 |
HMMの出力シンボル |
単語 |
開始終了状態 |
任意 |
初期状態遷移確率 |
ランダム |
初期シンボル出力確率 |
ランダム |
初期状態確率 |
均等 |
異なり語彙数 |
6418 |
学習データset |
odd4000 |
学習データ数 |
4000文 |
単語総数 |
57354単語 |
学習終了条件 |
生成確率上昇率1%未満 |
Jin'ichi Murakami
平成13年10月5日