next up previous contents
次へ: 言語データ 上へ: 単語を入力単位とした日本文文法の自動獲得 戻る: 単語を入力単位とした日本文文法の自動獲得   目次


HMMによる言語のモデル化

前節では、Ergodic HMM の学習に品詞などのカテゴリーに分類した言語データ を用いた。本節では、実際の会話から作成した文単位に、単語列(品詞系列で はない)をErgodic HMMに学習させて、確率つきネットワーク文法を自動的に 抽出することを試みた。品詞情報を持たない単語列を学習させることにより、 文法だけでなく、単語のカテゴリーも出力の偏りとして同時に学習されること が期待できる。

また得られた言語モデルを文音声認識システムの言語モデルとして利用するこ とで、この言語モデルの有効性を研究した。

図 9.6: HMMを用いた文法の自動獲得
\begin{figure}\begin{center}
\epsfile{file=Ergodic-HMM/Figure/how2get.L-model.ps,width=140mm}
\end{center}\end{figure}



Jin'ichi Murakami 平成13年1月5日