状態数を, 不特定話者で最も認識精度が高いアクセントtriphoneモデル, 状態数無 調整の状態共有型HMM, FBANKの話者mauにおいて簡単に調査した. 状態数の調査結 果を表57に示す. なお, 表中の列の意味を以下に示す.
m-a0302001+u0303001
の音素表記の中心音素はaである.
共有された状態の一部を例として表58に示す. 表において, 共有
状態名のST_N_2_1
は中心音素NのHMMの状態2の17番目の共有状態の名前を示
す. 例えば, ST_N_2_17
において, a0201000-N0202001+pau,
a0403001-N0404001+pauおよびa0403020-N0404020+pauの音素HMMが状態2を共有して
いる.
調査結果より以下の結果を得た.
音素HMMの状態2は音の立上り, 状態3は音の定常状態, 状態4は次の音への変化を表 現すると考えられる. また, 複雑な音を表現するには, 多くの状態数が必要になる と考えられる. ゆえに, 母音は音の定常部分が複雑で, 子音は音の変化部分が複雑 だと考えている.
音素 | 音素数 | 状態2 | 状態3 | 状態4 |
N | 302 | 19 | 22 | 13 |
a | 1724 | 24 | 31 | 28 |
b | 229 | 10 | 6 | 7 |
by | 5 | 1 | 1 | 1 |
ch | 119 | 5 | 4 | 4 |
d | 150 | 6 | 5 | 7 |
e | 662 | 14 | 26 | 25 |
f | 30 | 2 | 2 | 1 |
g | 237 | 6 | 7 | 11 |
gy | 17 | 2 | 2 | 1 |
h | 108 | 7 | 6 | 6 |
hy | 10 | 1 | 1 | 1 |
i | 1235 | 34 | 42 | 37 |
j | 124 | 7 | 5 | 5 |
k | 446 | 15 | 17 | 12 |
ky | 38 | 2 | 4 | 4 |
m | 329 | 11 | 10 | 8 |
my | 9 | 1 | 1 | 1 |
n | 227 | 6 | 4 | 8 |
ny | 8 | 1 | 1 | 1 |
o | 1268 | 22 | 41 | 42 |
p | 47 | 2 | 2 | 2 |
pau | 202 | 20 | 24 | 24 |
py | 2 | 1 | 1 | 1 |
q | 114 | 5 | 3 | 4 |
r | 367 | 11 | 12 | 14 |
ry | 37 | 2 | 2 | 2 |
s | 252 | 11 | 11 | 8 |
sh | 185 | 9 | 9 | 6 |
t | 230 | 9 | 6 | 8 |
ts | 98 | 4 | 3 | 2 |
u | 1246 | 50 | 63 | 60 |
w | 68 | 4 | 3 | 2 |
y | 118 | 6 | 5 | 3 |
z | 134 | 6 | 4 | 4 |
合計 | 10377 | 336 | 386 | 363 |
共有状態名 | 共有された状態の集合 |
ST_N_2_1 |
e0301000-N0302001+g,e0301000-N0302001+k,e0301000-N0302001+ry,e0301011-N0302010+g,e0301011-N0302010+i0303010,e0301011-N0302010+k,e0301011-N0302010+ky,e0401000-N0402001+a0403001,e0401000-N0402001+g,e0401000-N0402001+i0403001,e0401000-N0402001+k,e0401000-N0402001+ky,e0401000-N0402001+ry,e0401011-N0402010+g,e0401011-N0402010+k,e0401011-N0402010+ry,e0401020-N0402021+g,e0401030-N0402031+g,e0401030-N0402031+k,e0401030-N0402031+ry,i0301000-N0302001+g,i0301000-N0302001+k,i0301011-N0302010+g,i0301011-N0302010+k,i0401000-N0402001+g,i0401000-N0402001+gy,i0401000-N0402001+i0403001,i0401000-N0402001+k,i0401000-N0402001+ky,i0401000-N0402001+ry,i0401011-N0402010+g,i0401011-N0402010+k,i0401011-N0402010+ry,i0503010-N0504010+g,u0301011-N0302010+i0303010,u0301011-N0302010+k,u0401000-N0402001+g,u0401000-N0402001+k,u0401011-N0402010+g,u0401030-N0402031+i0403031,u0401030-N0402031+ry |
ST_N_2_2 |
e0301000-N0302001+b,e0301011-N0302010+b,e0301011-N0302010+p,e0401000-N0402001+b,e0401000-N0402001+m,e0401000-N0402001+p,e0401000-N0402001+py,e0401011-N0402010+b,e0401011-N0402010+p,i0301011-N0302010+m,i0301011-N0302010+p,i0401000-N0402001+b,i0401000-N0402001+m,i0401000-N0402001+p,i0401011-N0402010+b,i0401030-N0402031+m |
... | ... |
ST_N_2_17 |
a0201000-N0202001+pau,a0403001-N0404001+pau,a0403020-N0404020+pau |
ST_N_2_18 |
a0302001-N0303001+pau |
ST_N_2_19 |
a0201011-N0202010+pau,a0302010-N0303010+pau,a0403010-N0404010+pau,a0403031-N0404030+pau,a0504020-N0505020+pau |