タスクの違いによるモデル化の変化

次へ: モデルからの文法抽出 上へ: HMMによるモデル化 戻る: 同一タスクにおけるモデル化の揺らぎ

タスクの違いによるモデル化の変化

データベースの説明に述べた通り、モデル化に使用したデータは、品詞の生成確率が若干異なっている。 (感動詞の生成確率が 11 $\%$ (SET1)、3 $\%$ (SET2)) 先に示した副詞を含む文節の生成確率も同様に異なっている。 (副詞単独、体言が後続、用言が後続の3グループの割合は、 69.5 $\%$ , 1.9 $\%$ , 28.5 $\%$ (SET1)、 86.1 $\%$ , 3.2 $\%$ , 10.6 $\%$ (SET2) である。 )

感動詞は、単独で文節となるので SET1とSET2で出現確率が異なってもモデルの遷移ネットワークの構造に大きな差異は見られない。ただし、ある遷移が感動詞だけを生成する割合は 16.8 $\%$ (SET1)より 21.1 $\%$ (SET2)が大きく、タスクがモデルに反映されている。
体言が後続する遷移の割合が 1.9 $\%$ (SET1)より 3.2 $\%$ (SET2)の方が大きい。このため、SET2をモデル化した場合、副詞が生成されるリンクは、状態数5のHMMから体言と用言の二つのグループに分化する。この場合もタスクが反映されている。

Jin'ichi Murakami 平成13年10月5日