next up previous contents
次へ: 品詞列を入力とした文節内文法の獲得 上へ: 確率的言語モデルによる自由発話認識に関する研究 戻る: まとめ   目次


Ergodic HMMを用いた確率付きネットワーク文法の自動獲得

音声認識に利用される言語モデルには、ネットワーク文法や文脈自 由文法に代表される構文モデル[31]や、bigram・trigramに代表される 統計モデル[40][49]がある。

ネットワーク文法や文脈自由文法などの構文的な言語モデルは、自 然言語処理の分野で実績があるが、言語に関する知識に基づいて構 文規則を人間が記述するため多大な労力を要する。一方bigramや trigramなどの統計モデルは、簡単なモデルであるため音声認識の 分野で言語モデルとして広く利用されている[40]が、このモ デルは言語を表現するにはあまりにも単純である。そこで両モデル の問題点を補完するために、構文モデルに確率を加えた確率つきネッ トワーク文法や確率つき文脈自由文法などの研究がある [28][39]。

ところで音声認識の分野では隠れマルコフモデル(HMM)が広く利用 されている[28]。HMMの種類の中で全状態間の遷移の許 された離散型Ergodic HMMの構造と確率つきネットワーク文法の構 造は類似している。 離散型Ergodic HMMは状態遷移確率、 シンボル出力確率、初期状態確率で特徴づけられ、確率つきネット ワーク文法は、状態遷移確率と単語(品詞)出力確率を用いて記述 した言語モデルである。Ergodic HMMの出力シンボルを単語(品詞) とすれば、両者は等価となる。 またHMMはBaum-Welch アルゴリズムを用いること によって、学習データの生成尤度が最大になるように各パラメータ を推定することができる。そこで言語モデルとしてErgodic HMMを 考え、テキストデータを学習データとしてBaum-Welch アルゴリズムを 利用することにより、確率つきネットワーク文法を自動的に獲得で きる可能性がある。

なお、村瀬等[57]はカテゴリーを学習データとして学習 後のモデルのエントロピーを研究し、bigramやtrigramと比較し、 Ergodic HMMによる言語のモデル化の可能性を報告している。 また、英語ではErgodic HMMは確率つ きネットワーク文法の獲得手段としてでなく [28][39]、形態素解析として研究されることが 多かった[38]。この場合、品詞ラベルが付与された大量 のテキストデータがあればHMMのパラメータは直接計算できるため、 品詞ラベルがないテキストデータからBaum-Welch アルゴリズ ムを用いた大規模な実験はまだ行なわれていないようである。

本論文では ATR対話データベース(ADD)[10]における日本語会話文を 全遷移型(Ergodic)HMMでモデル化することを試みた。 なお、入力データとして 単語を選択した場合、Ergodic HMMはネットワーク文法と同時に、 単語に対する新しい品詞体系を得ることができる可能性がある。こ の観点から学習後のErgodic HMMのパラメータを研究した。また文音 声認識における言語情報として用いたときの有効性なども研究した [94][95]。

図 9.1: Ergodic HMMを用いた確率つきネットワーク文法文法の自動獲得
\begin{figure}\begin{center}
\epsfile{file=Ergodic-HMM/Figure/how2get.L-model.ps,width=100mm}
\end{center}\end{figure}



Subsections

Jin'ichi Murakami 平成13年1月5日