next up previous
次へ: 16状態Ergodic HMMの解析結果 上へ: Ergodic HMMの定性的特徴 戻る: 4状態Ergodic HMMの解析結果

8状態Ergodic HMMの解析結果


8状態のErgodic HMMについて解析した結果を図  4 に示す。8状態のErgodic HMMでは4状態の 場合と比較して、文法的に同じような役割を果たす(品詞、活用形 が等しい)単語が、より細かくグループ化されていることがわかる。 また同一品詞が複数の遷移で出力されていることも多いが、この場 合、遷移の起点または終点が意味を持っていることが多い。以下に、 8状態Ergodic HMMから抽出される特徴を述べる。

$\bullet$
間投詞、感動詞について

間投詞(あのー、えー、など)や感動詞(もしもし、はい、など)がイ ニシャルノード(遷移を開始する状態)○ 0からの遷移で出力さ れている。

$\bullet$
品詞の基本形と活用形について

本動詞、補助動詞、助動詞、形容詞のような活用する単語は品詞の 基本形ではなく、活用形でグループ化されている。連体形は状態 ○ 3 への遷移
(○ 4,○ 1$\Rightarrow$3)で、連用形は状態 ○ 4への遷移
(○ 4,○ 5,○ 6$\Rightarrow$4)で、助動詞の終 止形は状態○ 6への遷移
(○ 1,○ 4,○ 5$\Rightarrow$6)で、それぞれ出力されている。

名詞は主として状態○ 037から状態 ○ 12に遷移する際に出力されている。 しかし、各々の遷移には特徴がある。 ○ 3からの遷移では、形式名詞が他の名詞類よりもやや高い。また、 ○ 3$\Rightarrow$1の遷移では準体助詞「の」が出力 されている。状態○ 7からの遷移では、個々の単語出力の上位 は代名詞が多い。状態○ 0からの遷移では、主として形式名詞 「方」(ほう)が出力されている。また、名詞以外の単語では副詞 の出力が多く見られた。

$\bullet$
格助詞について

格助詞は複数の遷移 (○ 2$\Rightarrow$0,○ 4,○ 5,○ 7), (○ 1$\Rightarrow$5,○ 7)で出力されているが、 各遷移は別々のそれぞれ異なる単語を出力している。例を以下に示 す。

$\ast$
状態○ 2$\Rightarrow$状態○ 0 「の」 (94%)
$\ast$
状態○ 2$\Rightarrow$状態○ 7 「から」 (28%) 「で」 (25%)
$\ast$
状態○ 2$\Rightarrow$状態○ 4 「と」 (94%)
$\ast$
状態○ 2$\Rightarrow$状態○ 5 「に」 (73%) 「で」 (18%)
$\ast$
状態○ 1$\Rightarrow$状態○ 5 「を」 (39%) 「が」 (27%)
$\ast$
状態○ 1$\Rightarrow$状態○ 7 「は」 (80%) 「も」 (7%)




Jin'ichi Murakami 平成13年10月5日