next up previous contents
次へ: 自由発話の文認識実験条件 上へ: 間投詞や言い直しの対策 戻る: garbageモデル(音響モデルによる対策)   目次

音素スキップ (言語モデルによる対策)

間投詞や言い直しは、文の全ての場所に出現する可能性があるという点でポー ズと似た性質がある。そこで、間投詞や言い直しを音素系列として認識しなが ら、言語モデルでは音素系列をスキップすることにより自由発話の音声が認識 できる。ただし、このようなアルゴリズムでは、音声データ全てが音素系列と 認識される可能性があるため、本節ではペナルティとして音素のtrigramを 使用する。

例えば「``東京都'' ``港区'' ``新橋'' ``あのう(anou)'' ``1丁目''」と発 声されたとする。また「あのう」は間投詞とする。

このときの 言語モデルの連鎖確率値は $P$( ``新橋'' $\vert$ ``東京都'', ``港 区'') $\times P( /a/\vert/sh/, /i/ ) \times P ( /n/\vert/i/,/a/ ) \times P
( /o/\vert/a/,/n/ ) \times P( /u/\vert/n/,/o/ )
\times P$(``1丁目'' $\vert$ ``港区'' ``新橋'' )と計算する。

ここで、 $ P( /a/\vert/sh/, /i/ ) $は音素のtrigramでペナルティ、 $P$(``1丁目'' $\vert$ ``港区'' ``新橋'' )は単語のtrigramで、''あのう''を音素系列と見てスキップしたことを意味する。

この方法は、garbageモデルを言語モデルで実現する方法であるとも言える。ま た、既に提案されている未知語検出のアルゴリズムと基本的には同一の思想で ある [6], [31], [26], [29], [44], [17]。 ただし、これらの論文では未知語検出を目的にしている。 また、使用している言語モデルも異なる。



Jin'ichi Murakami 平成13年1月5日