next up previous contents
次へ: 論文の構成 上へ: 序論 戻る: 研究の背景   目次

本研究の目的

日本語において確率的な言語モデルの研究の遅延の1つの理由に、コンピュー タに読み込める形で大量のテキストが存在しなかったことがあげられる。し かし、この状況も新聞記事がCD-ROMで提供されるようになり、国際電気通信 基礎技術研究所(ATR)が各種対話データを販売する[10]など、状 況が変化し始めている。

そこで、本論文では、日本語において$N$-gramモデルの有効性をシミュレー ションや実際の音声認識実験などで定量的に示す。また自由発話認識に向け て、自由発話の言語的特徴や音響的な特徴を研究した。そして実際に自由発話 認識にむけた文音声認識のアルゴリズムを提案し、認識実験の結果について 報告する。

また、確率的な言語モデルとして$N$-gramモデルの他に確率つきネットワー ク文法について報告する。確率つきネットワーク文法とErgodic HMMは、出 力シンボル確率を単語の出力確率に置き換えた場合、同一のパラメータを持 つ。したがって、大量のテキストからBaum-Welchアルゴリズムを用いることで、確率 つきネットワーク文法が自動的に獲得できる。

最後に、今後の自由発話認識に向けて役立つと思われる、韻率情報が持つ情 報量と、複数話者が同時に発話している場合のErgodic HMMを用いた話者識 別方法について報告する。



Jin'ichi Murakami 平成13年1月5日