従来の音声認識アルゴリズムにおける認識率の各発話様式の差を調 べるために音素の認識実験を行なった。ただし、学習データとテス トデータにおいて融合ラベルを付与された音素は実験から除いた。 認識アルゴリズムには、混合連続分布型HMMを用い、学習データに は、単語発声から視察によって切り出した音素を使用した。その他 の実験条件を表3に示す。実験は、 同一話者の単語発声と、文節単位の朗読発声と、文単位の朗読発声、 および自由発話の、4種類のデータで行なった。
各発声様式における音素認識誤り率を図 3に、各音素毎の音素認識率を 表4 に示す。この結果から次のよ うな傾向が見られる。
認識対象 | 32音素 |
サンプリング周波数 | 12kHz |
話者 | 男性アナウンサー |
学習データ | 単語音声 |
音響パラメータ | log power + 16次LPCcepstrum |
+ log power + 16次cepstrum | |
フレーム窓長 | 20ms |
フレーム周期 | 5ms |
音素モデル | 3state 10 mixture Gaussian |
continuous HMM |