次へ: モデルからの文法抽出
上へ: HMMによるモデル化
戻る: 同一タスクにおけるモデル化の揺らぎ
データベースの説明に述べた通り、
モデル化に使用したデータは、
品詞の生成確率が若干異なっている。
(感動詞の生成確率が 11 (SET1)、3 (SET2))
先に示した副詞を含む文節の生成確率も
同様に異なっている。
(副詞単独、
体言が後続、
用言が後続の3グループの割合は、
69.5, 1.9, 28.5 (SET1)、
86.1, 3.2, 10.6 (SET2)
である。
)
-
感動詞は、
単独で文節となるので
SET1とSET2で出現確率が異なっても
モデルの遷移ネットワークの構造に
大きな差異は見られない。
ただし、
ある遷移が感動詞だけを生成する割合は
16.8 (SET1)より
21.1 (SET2)が大きく、
タスクがモデルに反映されている。
-
体言が後続する遷移の割合が
1.9 (SET1)より
3.2 (SET2)の方が大きい。
このため、SET2をモデル化した場合、
副詞が生成されるリンクは、
状態数5のHMMから体言と用言の二つのグループに分化する。
この場合もタスクが反映されている。
Jin'ichi Murakami
平成13年10月5日