文法抽出に対する考察

次へ: まとめ 上へ: HMMによるモデル化 戻る: モデルからの文法抽出

文法抽出に対する考察

HMMによる文法抽出は、エントロピーを指標としてモデルを評価することができるが、最適なモデルを得るためには、生成・評価のサイクルを繰り返しながらエントロピーの小さなモデルを探す必要がある。これを避けるには、例えば、エントロピーの小さなモデルを生成したHMMの初期状態を解析し、得られた知見によってよりエントロピーの小さいモデルを生成するように初期状態を設定する手法が考えられる。文節の開始・終了状態を指定するだけでも冗長なイニシャル・ノードや遷移を解消できるものと思われる。

初期状態とともに考慮すべきこととしてモデルの状態数の最適化がある。状態数の多いHMMはより複雑なタスクを扱うことができるが状態数が多過ぎるとかえって冗長・曖昧性が生じ、モデルの最適性が失われてしまう。この問題は、タスクのパープレキシティを考慮して状態数を選択することにより、ある程度解消できる。

さらに、同じ品詞でも連体修飾・連用修飾を行なうものは、遷移が分化しているものがあるように、品詞のサブカテゴリを扱うことでより詳細なモデルを生成することや逆に、 HMMによって品詞のサブカテゴリ化を図ることができる。

Jin'ichi Murakami 平成13年10月5日