状態数を, 不特定話者で最も認識精度が高いアクセントtriphoneモデル, 状態数無 調整の状態共有型HMM, FBANKの話者mauにおいて簡単に調査した. 状態数の調査結 果を表57に示す. なお, 表中の列の意味を以下に示す.
m-a0302001+u0303001の音素表記の中心音素はaである.
共有された状態の一部を例として表58に示す. 表において, 共有
状態名のST_N_2_1は中心音素NのHMMの状態2の17番目の共有状態の名前を示
す. 例えば, ST_N_2_17において, a0201000-N0202001+pau,
a0403001-N0404001+pauおよびa0403020-N0404020+pauの音素HMMが状態2を共有して
いる.
調査結果より以下の結果を得た.
音素HMMの状態2は音の立上り, 状態3は音の定常状態, 状態4は次の音への変化を表 現すると考えられる. また, 複雑な音を表現するには, 多くの状態数が必要になる と考えられる. ゆえに, 母音は音の定常部分が複雑で, 子音は音の変化部分が複雑 だと考えている.
| 音素 | 音素数 | 状態2 | 状態3 | 状態4 |
| N | 302 | 19 | 22 | 13 |
| a | 1724 | 24 | 31 | 28 |
| b | 229 | 10 | 6 | 7 |
| by | 5 | 1 | 1 | 1 |
| ch | 119 | 5 | 4 | 4 |
| d | 150 | 6 | 5 | 7 |
| e | 662 | 14 | 26 | 25 |
| f | 30 | 2 | 2 | 1 |
| g | 237 | 6 | 7 | 11 |
| gy | 17 | 2 | 2 | 1 |
| h | 108 | 7 | 6 | 6 |
| hy | 10 | 1 | 1 | 1 |
| i | 1235 | 34 | 42 | 37 |
| j | 124 | 7 | 5 | 5 |
| k | 446 | 15 | 17 | 12 |
| ky | 38 | 2 | 4 | 4 |
| m | 329 | 11 | 10 | 8 |
| my | 9 | 1 | 1 | 1 |
| n | 227 | 6 | 4 | 8 |
| ny | 8 | 1 | 1 | 1 |
| o | 1268 | 22 | 41 | 42 |
| p | 47 | 2 | 2 | 2 |
| pau | 202 | 20 | 24 | 24 |
| py | 2 | 1 | 1 | 1 |
| q | 114 | 5 | 3 | 4 |
| r | 367 | 11 | 12 | 14 |
| ry | 37 | 2 | 2 | 2 |
| s | 252 | 11 | 11 | 8 |
| sh | 185 | 9 | 9 | 6 |
| t | 230 | 9 | 6 | 8 |
| ts | 98 | 4 | 3 | 2 |
| u | 1246 | 50 | 63 | 60 |
| w | 68 | 4 | 3 | 2 |
| y | 118 | 6 | 5 | 3 |
| z | 134 | 6 | 4 | 4 |
| 合計 | 10377 | 336 | 386 | 363 |
| 共有状態名 | 共有された状態の集合 |
ST_N_2_1 |
e0301000-N0302001+g,e0301000-N0302001+k,e0301000-N0302001+ry,e0301011-N0302010+g,e0301011-N0302010+i0303010,e0301011-N0302010+k,e0301011-N0302010+ky,e0401000-N0402001+a0403001,e0401000-N0402001+g,e0401000-N0402001+i0403001,e0401000-N0402001+k,e0401000-N0402001+ky,e0401000-N0402001+ry,e0401011-N0402010+g,e0401011-N0402010+k,e0401011-N0402010+ry,e0401020-N0402021+g,e0401030-N0402031+g,e0401030-N0402031+k,e0401030-N0402031+ry,i0301000-N0302001+g,i0301000-N0302001+k,i0301011-N0302010+g,i0301011-N0302010+k,i0401000-N0402001+g,i0401000-N0402001+gy,i0401000-N0402001+i0403001,i0401000-N0402001+k,i0401000-N0402001+ky,i0401000-N0402001+ry,i0401011-N0402010+g,i0401011-N0402010+k,i0401011-N0402010+ry,i0503010-N0504010+g,u0301011-N0302010+i0303010,u0301011-N0302010+k,u0401000-N0402001+g,u0401000-N0402001+k,u0401011-N0402010+g,u0401030-N0402031+i0403031,u0401030-N0402031+ry |
ST_N_2_2 |
e0301000-N0302001+b,e0301011-N0302010+b,e0301011-N0302010+p,e0401000-N0402001+b,e0401000-N0402001+m,e0401000-N0402001+p,e0401000-N0402001+py,e0401011-N0402010+b,e0401011-N0402010+p,i0301011-N0302010+m,i0301011-N0302010+p,i0401000-N0402001+b,i0401000-N0402001+m,i0401000-N0402001+p,i0401011-N0402010+b,i0401030-N0402031+m |
| ... | ... |
ST_N_2_17 |
a0201000-N0202001+pau,a0403001-N0404001+pau,a0403020-N0404020+pau |
ST_N_2_18 |
a0302001-N0303001+pau |
ST_N_2_19 |
a0201011-N0202010+pau,a0302010-N0303010+pau,a0403010-N0404010+pau,a0403031-N0404030+pau,a0504020-N0505020+pau |