16状態のErgodic HMMについて解析した結果を図 5 に示す。16状態のErgodic HMMでは、多く の場合1つの状態遷移に1つの品詞が出力されている。また初期状 態確率は2つの状態(○ 2,○ 3)で値を持っている。つまり、 8状態に比べ、より細かい品詞でグループ化がされていることがわ かる、16状態Ergodic HMMから抽出される特徴を品詞ごとに述べる。
間投詞、感動詞は、4、8状態の場合と同様に初期状態確率の高い状 態(○ 2, ○ 3)からの遷移で出力される。ただし、初期状 態確率は状態○ 2○ 3の2状態に値を持ち、初期状態確率 が最も高い状態○ 2での自己ループは見られない。
名詞は主として、○ 5, ○ 6, ○ 7から○ 1, ○ 9, ○ 12への遷移で出力されている。
状態○ 6○ 7からの遷移では主として形式名詞が出力され、 状態○ 5からの遷移では、形式名詞以外の名詞が出力される。 このように普通名詞と形式名詞の分化がおきている。なお、 状態○ 5からの遷移では、出力確率が特に高い単語はなく、多 種類の普通名詞の単語がこの遷移で出力されている。
8状態のErgodic HMMでは活用形でグループ化されていた。これに対 し16状態では品詞の基本形でもグループ化されている。本動詞は状 態○ 8○ 5からの遷移で、補助動詞は状態 ○ 0○ 4からの遷移で、助動詞は状態 ○ 0○ 11○ 13からの遷移でそれぞれ出力されている。
本動詞は複数の遷移において出力されているが、主に ○ 8,○ 15からの遷移で出力される。しかし、各遷移によっ て出力される単語に違いが見られる。また、本動詞の中でも連用形 が他の活用形に比べ非常に高い。補助動詞は、○ 0,○ 4 からの遷移で出力される。本動詞と同様に連用形の出力が多く、助 動詞をともなうことが多い。また。状態○ 0から出力される単 語は表記が異なるものの意味的には「する」と同じものが多い。助 動詞は、遷移の起点となる状態によって全く異なるを出力しており、 8状態と同様に「です」「ます」がグループ化され、さらに16状態 では「た」「たい」が他の単語からグループ化して出力されている。
格助詞は、主に名詞を出力した遷移の集まる状態 ○ 8○ 9○ 12からの遷移で出力される。 例を次に示す。8状態では同じ遷移で出力されていた「で」と「に」、 「が」と「を」が別々の遷移に分かれて出力されている。