next up previous contents
次へ: アクセント情報の持つ情報量の基本的な測定方法 上へ: 確率的言語モデルによる自由発話認識に関する研究 戻る: まとめ   目次


音声におけるアクセント情報の持つ情報量の考察

音声信号は、音素情報の他にも韻律情報を含んでいる。したがって 音声合成の研究では、自然な音声を合成するためにアクセント・ポー ズ・イントネーションなどの韻律情報を自動的に付与する方法につ いて研究が行なわれてきた[47][21]。これ らの論文では、一般名詞・固有名詞・数量表現などにおける複数の 読みや特殊な読みの存在や、名詞連続複合語や文節におけるアクセ ント核の移動などの問題に対する解決方法が提案されていて、一般 の日本文(漢字仮名交じり文)に対し高い精度で韻律情報を付与で きる。

しかし、音声認識の研究では主に音素情報に着目されていて、韻律情 報を利用した研究は全体としては少ない。高橋ら[81]や Singerら[77]は、韻律情報を使用することにより単語認識 性能や音素認識性能が向上することを報告している。だが、これらの 研究結果を見ると認識性能が大きく改善されたとは言えない。 これは、現段階ではピッチの抽出が必ずしも容易でないことや、韻律 情報は個人差が多く、さらに地域差が存在することなどが理由にある と思われる。しかし、韻律情報は音声認識における1つの有効な情報 源であり、特に日本語においては同音異義語が多いことも考えると、 今後も韻律情報を利用した音声認識の手法の研究は重要であろう。

ところで、韻律情報の有効性を他の種類の情報(音響情報、言語情報) と同一の尺度で比較することも重要な課題であると考えられる。柴田 ら[71]は辞書から同音異義語の数とアクセント型を研究し、 この結果日本語において、ある語が他の同音異義語からアクセントに よって弁別される確率は13.57%と計算している。しかし、このよう に韻律の持つ情報量を定量的に測定した研究は少ない [54][71]。

本章では、仮名漢字変換において出力される漢字仮名交じり文の候 補の数の減少度という点に着目して、韻律の持つ情報量を研究した。 情報量は、その情報が存在する場合と存在しない場合の曖昧さの差と して捉えることができる。したがって、韻律情報の持つ情報量は、音 素情報から生成される漢字仮名交じり文の数と、音素および韻律情報 から生成される漢字仮名交じり文の数を比較することによって測定す ることが可能と思われる。このとき、音素および韻律情報から生成さ れる漢字仮名交じり文の数の推定方法が問題になるが、これは、音声 合成において研究された漢字仮名交じり文から韻律情報への変換の機 能を用いることにより、ある程度解決できる。

韻律情報は$F_0$, power, durationなどの多くの要素から構成されて いるが、本章では、この中から特にアクセント句境界の位置および アクセント核の位置の持つ情報量に焦点を当てて情報量を測定した。



Subsections

Jin'ichi Murakami 平成13年1月5日