next up previous contents
次へ: 発話速度からみた自由発話 上へ: 話者ごとの自由発話の音響的な特徴 戻る: ラベリング作業からみた自由発話   目次

融合ラベルの付与率から見た自由発話

  1. 話者ごとの融合ラベルの付与率

    ATRでは、発話テキストを参照しながら人手で音素境界を決定するラベリング 作業において、音素境界が不明瞭な音素区間に対して付与するラベルのことを融 合ラベルと呼んでいる。この融合ラベルの付与率を4名の話者の自由発話と朗読発 話において調べた。この結果を図6.9に示す。この図か ら以下のことがわかる。

    図 6.9: 話者ごとの融合ラベルの付与率の変化
    \begin{figure}\begin{center}
\fbox{\epsfile{file=PS1/confusion-label.ps,width=100mm}}\end{center}\end{figure}

    1. 自由発話の融合ラベルの付与率は朗読発話より若干高く、 自由発話では、全音素の25%から32%が融合ラベルに、 朗読発話では、全音素の24%から30%が融合ラベルになる。

    2. 自由発話、朗読発話共に、融合ラベルの付与率に話者間の相違が見られる。

    3. 自由発話と朗読発話を比較すると、融合ラベルの付与率の増加の割合に話者 の相違が見られる。話者MMYでは2%(29.5% $\rightarrow $ 30.1%)しか増加しな いのに対し、話者FAKでは 21%(23.8% $\rightarrow $ 28.7%)増加する。

    なお、 /i,y/, /u,g/, /N,g/, /N,j/, /f,u/, /i,m/, /k,u/, /u,h/, /u,w/, /u,y/, /u,n/, /N,b/, /N,d/, /N,n/, /a,a/, /e,e/, /e,i/, /i,i/, /k,i/, /o,o/, /o,u/, /s,u/, /sh,i/, /u,u/ などの音素環境は 朗読発話、自由発話ともに、融合ラベルになりがちであった。 また、文末の2音素を調査したところ、 母音では/e/と/u/、子音では/g/と /n/が融合ラベルになりやすかった。

  2. 発話様式の違いによる融合ラベルの付与率の変化

    話者2名において単語発話、文節の朗読発話、文の朗読発話、自由発話における 融合ラベルの付与率、発話速度、および音素認識誤り率を調査した。これらのデー タは、文節の朗読発話と文の朗読発話の発話内容は同一であるが、単語発話およ び朗読発話および自由発話の発話内容は異なる。また、単語発話、文節の朗読発 話、文の朗読発話の発話内容は話者間に相違はないが、自由発話では、各話者の 発話内容は異なっている。なお単語発話のデータはATRのデータベースにおいて 通称(D0-D5)、文節の朗読発話は通称DSA、文の朗読発話には通称DSCと呼ばれて いるものを使用した。

    融合ラベルの付与率の結果を図 6.10に示す。この図から読みとれることを以下に示す。

    1. 自由発話と文の朗読発声を比較すると、融合ラベルの付与 率は話者MTKでは33%(23.9% $\rightarrow $ 31.7%)、話者FKNで は15% (23.0% $\rightarrow $ 26.4%)、増加する。

    2. 音素別に自由発話と文の朗読発声を比較すると、母音では /a/の増加が顕著である(MTK:4.0% $\rightarrow $ 13.3%, FKN:3.9% $\rightarrow $ 8.1%)。子音では、/m/の増加が著しい (MTK:1.0% $\rightarrow $ 18.1%, FKN:1.6% $\rightarrow $ 10.8%)。

    3. 自由発話では、全音素の約$1/4$以上が融合ラベルになる。

    4. 単語発声・文節単位の朗読発声・文単位の朗読発声では融合 ラベルの付与率に話者の相違は見られない。しかし、自由発話では 話者の相違が見られる(MTK:31.7%, FKN:26.4%)。

    5. 単語発声・文節単位の朗読発声・文単位の朗読発声・自由発話 の順に融合ラベルの付与率が増加する。

    図 6.10: 発話様式の違いによる融合ラベルの付与率の変化
    \begin{figure}\begin{center}
\fbox{\epsfile{file=FIGURE/figure3.10.ps,width=100mm}}\end{center}\end{figure}



Jin'ichi Murakami 平成13年1月5日