next up previous
次へ: 認識精度(Phone Accuracy)から見た自由発話 上へ: 自由発話の特徴 戻る: 融合ラベルの付与率から見た自由発話

発話速度からみた自由発話

ここでは、自由発話と朗読発話の発話速度の差をモーラ速度で調査した。ただし、 息つぎなどの長いポーズ区間および間投詞および言い直しの音声区間は除去した。 この結果を図5に示す。

図 5: 発話様式の違いによる発話速度の変化
\includegraphics[width=65mm]{FIGURE/mora-speed.ps}

また、自由発話および朗読発話における各音素の平均音素継続時間を表 4に示す。ただし融合ラベルが付与された音素は評 価対象から削除した。


自由発話
表 4: 各音素ごとの平均音素継続時間
話者 MTK MMY FKN FAK
音素 平均 標準偏差 平均 標準偏差 平均 標準偏差 平均 標準偏差
  (ms)   (ms)   (ms)   (ms)  
a 92.6 49.1 87.6 41.0 86.1 38.2 93.4 63.4
i 72.0 36.1 65.1 39.1 64.2 36.8 70.5 45.5
u 85.0 62.0 77.0 53.8 69.0 43.4 77.7 45.5
e 93.5 64.3 92.7 72.2 80.6 44.3 85.0 53.7
o 91.8 61.5 97.4 71.6 92.5 59.6 101.3 74.5
p 61.4 7.1 17.4 6.9 20.7 7.8 12.8 4.5
t 41.4 21.0 20.4 7.1 17.2 5.7 14.8 5.8
k 49.3 19.9 36.3 19.3 30.2 10.5 26.6 12.1
b 48.3 13.4 11.1 5.0 11.8 4.4 11.7 2.4
d 43.5 16.9 12.0 4.7 11.6 4.0 10.8 3.3
g 45.9 25.3 13.8 4.7 13.9 5.5 14.3 5.2
m 53.1 17.3 47.1 19.6 52.6 15.6 51.8 17.2
n 48.2 18.3 41.6 20.0 47.9 19.1 53.4 24.6
N 75.7 24.0 66.6 37.5 55.2 28.2 70.7 32.4

朗読発話
話者 MTK MMY FKN FAK
音素 平均 標準偏差 平均 標準偏差 平均 標準偏差 平均 標準偏差
  (ms)   (ms)   (ms)   (ms)  
a 100.2 57.5 88.7 36.3 88.0 33.3 91.5 43.1
i 81.3 46.9 70.8 36.3 63.6 30.9 70.7 35.1
u 76.1 48.6 71.2 42.0 66.8 39.4 73.3 38.5
e 92.2 67.3 85.6 58.6 73.6 28.6 82.3 41.8
o 86.9 50.2 91.7 53.5 86.5 38.5 94.5 46.7
p 61.3 14.1 17.6 7.4 16.8 4.5 17.9 8.9
t 40.1 22.9 18.6 6.7 15.3 4.6 13.8 4.3
k 42.5 18.7 35.0 18.1 28.1 10.5 28.1 12.8
b 52.9 38.9 9.7 2.2 11.6 5.1 10.0 0.0
d 43.1 18.7 11.7 4.1 11.3 3.1 10.0 2.5
g 45.6 26.7 19.7 9.8 13.6 5.7 13.5 4.0
m 53.4 18.1 48.1 19.0 47.2 14.2 50.1 14.6
n 47.3 15.5 44.5 21.7 44.1 17.6 48.4 16.1
N 103.6 57.4 70.2 33.4 63.3 37.7 65.3 24.1

これらの結果から読み取れることを以下に示す。

  1. 自由発話の発話速度は朗読発話より早い。

  2. 自由発話の発話速度は8.5(mora/sec)から8.6(mora/sec)である。

  3. 朗読発話の発話速度は自由発話より話者の相違が大きく8.1(mora/sec)から 8.5(mora/sec)である。

  4. 話者FAKを除くと、自由発話における母音/a/の平均音素継続時間は朗読発話 より短い。しかし母音/u/,/e/,/o/は朗読発話より長い。

  5. 話者MTKを除くと、自由発話の音素継続時間の分散は朗読発 話より大きい音素が多い。

なお、話者MMYにおける音素/a/と/k/の継続時間毎の分布図を図 6に示す。この図では、横軸は音素の継続時間で、 縦軸は出現回数である。この図から、音素/a/では自由発話の音素継続時間の 分散は朗読発話より大きいことがわかる。しかし音素/k/では継続時間の分散 の差が小さいことがわかる。

図 6: 継続時間の分布
\includegraphics[width=65mm]{FIGURE/distribution-map.ps}


next up previous
次へ: 認識精度(Phone Accuracy)から見た自由発話 上へ: 自由発話の特徴 戻る: 融合ラベルの付与率から見た自由発話
Jin'ichi Murakami 平成13年5月7日