next up previous
次へ: Ergodic HMMの定性的特徴 上へ: Ergodic HMMによる言語のモデル化 戻る: 言語データ

実験条件


前節で作成した対話データodd4000を学習データとし、状態数の異なる 4種類の状態遷移出力型Ergodic HMM (2状態、4状態、8状態、16状態) でモデル化の実験を行なった。Baum-Welch algorithmの学習終了条件 として、シンボル系列を生成する確率の上昇率がある一定値以下に なった場合に学習を終了させる方式を採用した。実験の条件を表  2 にまとめた。




表 2: 言語モデル生成実験の条件
HMMの構造 状態遷移出力型Ergodic HMM
HMMの状態数 2状態,4状態,8状態,16状態
HMMの出力シンボル 単語
開始$\cdot $終了状態 任意
初期状態遷移確率 ランダム
初期シンボル出力確率 ランダム
初期状態確率 均等
異なり語彙数 6418
学習データset odd4000
学習データ数 4000文
単語総数 57354単語
学習終了条件 生成確率上昇率1%未満





Jin'ichi Murakami 平成13年10月5日