次へ: モデルからの文法抽出
上へ: HMMによるモデル化
戻る: 同一タスクにおけるモデル化の揺らぎ
データベースの説明に述べた通り、
モデル化に使用したデータは、
品詞の生成確率が若干異なっている。
(感動詞の生成確率が 11
(SET1)、3
(SET2))
先に示した副詞を含む文節の生成確率も
同様に異なっている。
(副詞単独、
体言が後続、
用言が後続の3グループの割合は、
69.5
, 1.9
, 28.5
(SET1)、
86.1
, 3.2
, 10.6
(SET2)
である。
)
-
感動詞は、
単独で文節となるので
SET1とSET2で出現確率が異なっても
モデルの遷移ネットワークの構造に
大きな差異は見られない。
ただし、
ある遷移が感動詞だけを生成する割合は
16.8
(SET1)より
21.1
(SET2)が大きく、
タスクがモデルに反映されている。
-
体言が後続する遷移の割合が
1.9
(SET1)より
3.2
(SET2)の方が大きい。
このため、SET2をモデル化した場合、
副詞が生成されるリンクは、
状態数5のHMMから体言と用言の二つのグループに分化する。
この場合もタスクが反映されている。
Jin'ichi Murakami
平成13年10月5日