next up previous contents
次へ: 音声認識の構成 上へ: paper5 戻る: はじめに   目次

音声認識

音声認識とは,音声波に含まれる情報を計算機によって抽出し,判定することで ある.音声認識の処理は,以下のような利点がある.

しかし,その実現は容易ではない.以下に音声認識の難しさとして,4点につい て説明する.音響モデルに関連して,一つは調音結合の効果として,単語や文章 を発声したときの各音素スペクトルが,前後の音素の影響を受けて変化する点で ある.また区分化の難しさとして,音声は草書で書かれた文字列のようなもので, 音素や単語の境界を決定することが難しい.これに関しては,音声の開始 と終了の検出も同様に困難である.三点目として,個人差による変動がある.同 じ言葉でも,話し方や発声器官の違いから人によって音声は異なる.また,同じ 人の音声でも,雑音や伝送歪みなどによって変動する.最後に,言語モデルに関 連して,そのモデルのあいまい性が挙げられる.話し言葉には書き言葉とは違う 多くの文法的ゆらぎがあり,モデル化が非常に難しい.



Subsections

平成25年10月13日