8状態のErgodic HMMについて解析した結果を図 4 に示す。8状態のErgodic HMMでは4状態の 場合と比較して、文法的に同じような役割を果たす(品詞、活用形 が等しい)単語が、より細かくグループ化されていることがわかる。 また同一品詞が複数の遷移で出力されていることも多いが、この場 合、遷移の起点または終点が意味を持っていることが多い。以下に、 8状態Ergodic HMMから抽出される特徴を述べる。
間投詞(あのー、えー、など)や感動詞(もしもし、はい、など)がイ ニシャルノード(遷移を開始する状態)○ 0からの遷移で出力さ れている。
本動詞、補助動詞、助動詞、形容詞のような活用する単語は品詞の
基本形ではなく、活用形でグループ化されている。連体形は状態
○ 3 への遷移
(○ 4,○ 1○ 3)で、連用形は状態
○ 4への遷移
(○ 4,○ 5,○ 6○ 4)で、助動詞の終
止形は状態○ 6への遷移
(○ 1,○ 4,○ 5
○ 6)で、それぞれ出力されている。
名詞は主として状態○ 0○ 3○ 7から状態 ○ 1○ 2に遷移する際に出力されている。 しかし、各々の遷移には特徴がある。 ○ 3からの遷移では、形式名詞が他の名詞類よりもやや高い。また、 ○ 3○ 1の遷移では準体助詞「の」が出力 されている。状態○ 7からの遷移では、個々の単語出力の上位 は代名詞が多い。状態○ 0からの遷移では、主として形式名詞 「方」(ほう)が出力されている。また、名詞以外の単語では副詞 の出力が多く見られた。
格助詞は複数の遷移 (○ 2○ 0,○ 4,○ 5,○ 7), (○ 1○ 5,○ 7)で出力されているが、 各遷移は別々のそれぞれ異なる単語を出力している。例を以下に示 す。