次へ: HMMと確率つきネットワーク文法 上へ: Ergodic HMMによる確率つきネットワーク文法の獲得の可能性について The Possibility 戻る: Ergodic HMMによる確率つきネットワーク文法の獲得の可能性について The Possibility

はじめに

音声認識に利用される言語モデルには、ネットワーク文法や文脈自由文法に代表される構文モデル[1]や、bigram・trigramに代表される統計モデル[2][3]がある。

ネットワーク文法や文脈自由文法などの構文的な言語モデルは、自然言語処理の分野で実績があるが、言語に関する知識に基づいて構文規則を人間が記述するため多大な労力を要する。一方bigramや trigramなどの統計モデルは、簡単なモデルであるため音声認識の分野で言語モデルとして良く利用されている[2]が、このモデルは言語を表現するにはあまりにも単純である。そこで両モデルの問題点を補完するために、構文モデルに確率を加えた確率つきネットワーク文法や確率つき文脈自由文法などの研究がある [4][5]。

ところで音声認識の分野では隠れマルコフモデル(HMM)が良く利用されている[4]。HMMの種類の中で全状態間の遷移の許された離散型Ergodic HMMの構造と確率つきネットワーク文法の構造は類似している。またHMMはBaum-Welch algorithmを用いることによって、学習データの生成尤度が最大になるように各パラメータを推定することができる。そこで言語モデルとしてErgodic HMMを考え、テキストデータを学習データとしてBaum-Welch algorithmを利用することにより、確率つきネットワーク文法を自動的に獲得できる可能性がある。

なお、村瀬等[7]はカテゴリーを学習データとして学習後のモデルのエントロピーを調べ、bigramやtrigramと比較し、 Ergodic HMMによる言語のモデル化の可能性を報告している。田本等[8]は品詞を学習データとして、学習後のErgodic HMM を解析し、その形態が従来使われているネットワーク文法と類似していることを報告している。また、英語ではErgodic HMMは確率つきネットワーク文法の獲得手段としてでなく [4][5]、形態素解析として研究されることが多かった[6]。この場合、品詞ラベルが付与された大量のテキストデータがあればHMMのパラメータは直接計算できるため、品詞ラベルがないテキストデータからBaum-Welchの学習アルゴリズムを用いた大規模な実験はまだ行なわれていないようである。

本論文では日本語においてテキストデータを単語の系列と見なして Ergodic HMMを学習させた。この場合Ergodic HMMはネットワーク文法と同時に、単語に対する新しい品詞体系を得ることができる可能性がある。この観点から学習後のErgodic HMMのパラメータを調べた。また文音声認識における言語情報として用いたときの有効性なども調べた[9][10]。

Jin'ichi Murakami 平成13年10月5日