next up previous contents
次へ: 認識精度(phone accuracy)から見た自由発話 上へ: 話者ごとの自由発話の音響的な特徴 戻る: 融合ラベルの付与率から見た自由発話   目次

発話速度からみた自由発話

  1. 話者ごとの発話速度の変化

    ここでは、自由発話と朗読発話の発話速度の差をモーラ速度で調査した。ただし、 息つぎなどの長いポーズ区間および間投詞および言い直しの音声区間は除去した。 この結果を図6.11に示す。

    図 6.11: 話者ごとの発話様式の違いによる発話速度の変化
    \begin{figure}\begin{center}
\fbox{\epsfile{file=PS1/mora-speed.ps,width=100mm}}\end{center}\end{figure}

    また、自由発話および朗読発話における各音素の平均音素継続時間を表 6.6に示す。ただし融合ラベルが付与された音素は評 価対象から削除した。


    (a) 自由発話
    表 6.6: 各音素ごとの平均音素継続時間
    話者 MTK MMY FKN FAK
    音素 平均 (ms) 標準偏差 平均 (ms) 標準偏差 平均 (ms) 標準偏差 平均 (ms) 標準偏差
    a 92.6 49.1 87.6 41.0 86.1 38.2 93.4 63.4
    i 72.0 36.1 65.1 39.1 64.2 36.8 70.5 45.5
    u 85.0 62.0 77.0 53.8 69.0 43.4 77.7 45.5
    e 93.5 64.3 92.7 72.2 80.6 44.3 85.0 53.7
    o 91.8 61.5 97.4 71.6 92.5 59.6 101.3 74.5
    p 61.4 7.1 17.4 6.9 20.7 7.8 12.8 4.5
    t 41.4 21.0 20.4 7.1 17.2 5.7 14.8 5.8
    k 49.3 19.9 36.3 19.3 30.2 10.5 26.6 12.1
    b 48.3 13.4 11.1 5.0 11.8 4.4 11.7 2.4
    d 43.5 16.9 12.0 4.7 11.6 4.0 10.8 3.3
    g 45.9 25.3 13.8 4.7 13.9 5.5 14.3 5.2
    m 53.1 17.3 47.1 19.6 52.6 15.6 51.8 17.2
    n 48.2 18.3 41.6 20.0 47.9 19.1 53.4 24.6
    N 75.7 24.0 66.6 37.5 55.2 28.2 70.7 32.4

    (b) 朗読発話
    話者 MTK MMY FKN FAK
    音素 平均 (ms) 標準偏差 平均 (ms) 標準偏差 平均 (ms) 標準偏差 平均 (ms) 標準偏差
    a 100.2 57.5 88.7 36.3 88.0 33.3 91.5 43.1
    i 81.3 46.9 70.8 36.3 63.6 30.9 70.7 35.1
    u 76.1 48.6 71.2 42.0 66.8 39.4 73.3 38.5
    e 92.2 67.3 85.6 58.6 73.6 28.6 82.3 41.8
    o 86.9 50.2 91.7 53.5 86.5 38.5 94.5 46.7
    p 61.3 14.1 17.6 7.4 16.8 4.5 17.9 8.9
    t 40.1 22.9 18.6 6.7 15.3 4.6 13.8 4.3
    k 42.5 18.7 35.0 18.1 28.1 10.5 28.1 12.8
    b 52.9 38.9 9.7 2.2 11.6 5.1 10.0 0.0
    d 43.1 18.7 11.7 4.1 11.3 3.1 10.0 2.5
    g 45.6 26.7 19.7 9.8 13.6 5.7 13.5 4.0
    m 53.4 18.1 48.1 19.0 47.2 14.2 50.1 14.6
    n 47.3 15.5 44.5 21.7 44.1 17.6 48.4 16.1
    N 103.6 57.4 70.2 33.4 63.3 37.7 65.3 24.1

    これらの結果から以下のことがわかる。

    1. 自由発話の発話速度は朗読発話より、やや早く、 自由発話の発話速度は8.5(morae/sec)から8.6(morae/sec)である。

    2. 朗読発話の発話速度は自由発話より話者の相違が大きく8.1(morae/sec)から 8.5(morae/sec)である。

    3. 話者FAKを除くと、自由発話における母音/a/の平均音素継続時間は朗読発話 より短い。しかし母音/u/,/e/,/o/は朗読発話より長い。

    4. 話者MTKを除くと、自由発話の音素継続時間の分散は朗読発 話より大きい音素が多い。

  2. 音素/a/と/k/の継続時間毎の分布図

    なお、話者MMYにおける音素/a/と/k/の継続時間毎の分布図を図 6.12に示す。この図では、横軸は音素の継続時間で、 縦軸は出現回数である。この図から、音素/a/では自由発話の音素継続時間の 分散は朗読発話より大きいことがわかる。しかし音素/k/では継続時間の分散 の差が小さいことがわかる。

    図 6.12: 音素/a/および/k/の継続時間の分布 ( 話者MMY )
    \begin{figure}\begin{center}
\fbox{\epsfile{file=PS1/distribution-map.ps,width=80mm}}\par\par\end{center}\end{figure}


next up previous contents
次へ: 認識精度(phone accuracy)から見た自由発話 上へ: 話者ごとの自由発話の音響的な特徴 戻る: 融合ラベルの付与率から見た自由発話   目次
Jin'ichi Murakami 平成13年1月5日