next up previous
次へ: 謝辞 上へ: main2 戻る: 音素スキップとgarbage モデルの比較

まとめ

本論文では、初めに連続音声認識アルゴリズムとしてフレーム同期型のフルサー チアルゴリズムについて述べた。次に計算量およびメモリ量を削減したアルゴ リズムを提案した。これらは、ビームサーチの採用とその改良に依存している。

次に自由発話の認識に向けてアルゴリズムの改良を行った。自由発話では認識 精度の高い音響モデルを作成することは困難であると考えられる。そこで perplexityの低い言語モデルに着目し、単語のtrigramを選択した。また、自 由発話に特有な間投詞や言い誤りは、音声のあらゆる場所に出現する可能性が ある。そこで、言語モデルにおいて、これらの言語現象をスキップすることで 対処した。

最後に、このアルゴリズムを使用して自由発話の認識実験を行った。その結果、 ビーム幅16384語彙数435において47.7%の文認識率が得られた。そして意味的 に正しい文を正解に含めた場合、1位文理解率で約 75%、8位までの累積文理 解率は90% になった。ただし、この自由発話のデータは、テキストを覚えて、 その意図を理解し、自由に発話した音声データであるため、言語モデルに対し てtext-open のデータであるが、発話内容はtext-closedに近い。 これらの実 験の結果、このアルゴリズムの有効性が示された。



Jin'ichi Murakami 平成13年10月2日