次へ: 実験条件
上へ: 評価実験
戻る: モーラ情報の付与
  目次
音素HMMの作成
この節では、音素HMMの作成手順を述べる。
今回の実験では音素HMMの作成に当り、次の2点を考慮した。
- 母音と撥音をモーラ情報で分類した場合、音素数の増加に伴い、音素ごとに作成
するHMMの数も増加する。これにより、学習データの数が同じ場合、
1つ当りの音素HMMの学習デー
タが減少してしまい、HMMパラメータの信頼度が低下する。
これを防ぐために、実験には半連続型HMMを使用した。
- HMMは初期モデルが重要であるため、まず
モーラ情報を使用しない学習データで、連続型の
HMMを学習し、
作成した連続型のHMMから、半連続型
のHMMを作成する。次に、このHMMのうち、母音と撥音をモーラ情報を使用した
モデルに複製することで半連続型の初期モデルを作成した。
すなわち、このときの各母音と撥音は
同じ音素であれば、モーラ情報によらず、同じ出力確率の分布と遷移確率をもつ。
作成手順を図に示す。図に示すように、音素HMMは
(a)連続型HMMの作成、(b)半連続型HMMの初期モデルの作成、(c)半連続型HMMの作
成の3ステップにより作成される。なお、
上述の理由から、従来法と本手法では、(a)(b)は共通
の手順で作成し、(c)において異なった手順により、それぞれの音素HMMを作成す
る。
- (a)
- 連続型HMMの作成
モーラ情報を使用していないラベルデータと波形データ
から、Viterbiアルゴリズムを使用して初期モデルを作成する。
この初期モデルを、Baum-Welchアルゴリズムを使用して再推定し、
連結学習を行い、連続型の音素HMMを作成する。
- (b)
- 半連続型HMMの初期モデルの作成
(a)で作成した音素HMMの混合ガウス分布を、すべての音素HMMのすべての
状態で共通にした半連続型の音素HMMを作成する
次のステップで(c-1)従来法(モーラ情報未使用)と(c-2)本手法(モーラ情報使用)
の作成手順が異なる。
- (c-1)
- 従来法の半連続型HMMの作成
(b)で作成した半連続型の音素HMMの初期モデルを、モーラ情報を使用し
ていないラベルデータと波形データから、再推定し、連結学習を行い、
半連続型の音素HMMを作成する。
- (c-2)
- 本手法の半連続型HMMの作成
(b)で作成した半連続型の音素HMMの初期モデルのうち、母音と撥音の音
素HMMに複製することにより、モーラ情報を使用した音素HMMを作成する。
この音素HMMを、モーラ情報を使用したラベルデータと波形データから、
再推定し、連結学習を行い、モーラ情報を使用した半連続型の音素HMMを
作成する。
この結果、単語音声認識に使用する音素HMMの種類は、従来法では26種類にな
り、本手法では119種類となった。
本手法の有効性を調べるため、
従来法で作成したモーラ情報を使用していない音素HMMと
本手法で作成したモータ情報を使用した音素HMMを用いて
単語音声認識を行った。
平成14年4月24日