next up previous
次へ: Ergodic HMMによる言語のモデル化 上へ: HMMと確率つきネットワーク文法 戻る: HMM

Ergodic HMMと確率つきネットワーク文法と品詞分類


ネットワーク文法は、言語を有限状態オートマトンでモデル化した もので、状態が遷移するときに単語が出力されるモデルである。こ のモデルに確率をつけた確率つきネットワーク文法はErgodic HMM と同じ構造を持っている。したがって言語モデルとしてErgodic HMMを用いた場合、Baum-Welch algorithmによってテキストデータ から尤度最大の条件で確率つきネットワーク文法を自動的に獲得で きる可能性がある。

さらに単語列を学習データとした場合、このネットワークでの挙動 が似た単語はネットワーク上の同一の状態遷移に集中する傾向があ ると思われる。一方、従来の品詞体系は基本的には構文的な観点で 分類されている。したがってこのグループ化は品詞と強い関連があ ると思われる。そこで同一遷移に出現する複数の単語を同一の品詞 と考えるような品詞分類と考えると、Ergodic HMMによりネットワー ク文法の獲得と同時に、尤度最大の基準での新しい品詞体系を得る 可能性がある。




Jin'ichi Murakami 平成13年10月5日