次へ:
同一タスクにおけるモデル化の揺らぎ
上へ:
HMMによるモデル化
戻る:
モデルからの文法抽出
ネットワークの形態
2状態HMMを除く各ネットワークに共通する部分として、 3個のノードで構成される自己遷移ループを持つ有向循環グラフが存在する。 (状態数の多いHMMでは、この特徴の一部が失われる。) その他のノードは、 この循環グラフに接続する非循環有向グラフを構成している。 この循環グラフ部がどのような遷移によって構成されているかをさらに 分析する。
自己遷移を持つノードのうち、 ひとつは体言に付属する部分に、 もうひとつは用言に付属する部分に相当する。 (8状態HMM
図
1
ノード
,
)
残りのノードは、感動詞、間投詞の自己遷移ループで、 用言や副詞などを生成した後、用言に続く部分を生成するノードに遷移する。
2状態HMMによるモデルは、 他の状態数のモデルとは異なり、 体言と用言にそれぞれに付属する語の部分の自己遷移ループを 自立語を生成するリンクが結合するモデルと、 体言、用言のような自立語の分化が縮退し 自立語を生成するリンクと付属語を生成する自己遷移ループのみで 構成されるモデルの形をとる。
非循環有向グラフの部分は、 1回から3回の遷移で循環グラフ部に到達する。 状態数の少ないHMMでは遷移は短く、状態数の増加に従って長い遷移が現れる。
すべてのグラフに共通して見られる傾向として、 体言に続く部分に接続するリンクは、体言が支配的に生成されるのに対し、 用言に続く部分に接続するリンクは、用言や副詞などの語が支配的である。
これらのノードは、5状態、8状態のHMMでは体言あるいは用言を 生成するリンクのいずれか一方のみを持ち、 ノードがはっきりと分化している。
10状態のHMMでは、 [接頭辞
名詞
数詞
接尾辞] といった 複雑な遷移 が観察できる一方、 ノード数が増え、リンクが増加しているにも関わらず、 支配的な遷移を行なうリンクがさほど増えていない。 状態遷移確率が平均化され、 あるノードが体言・用言のどちらに分化しているのか 明確に識別できない。
Jin'ichi Murakami 平成13年10月5日