next up previous contents
次へ: 自動ラベルと手動ラベルの平均の差 上へ: 実験結果 戻る: 実験結果   目次

自動ラベルと手動ラベルの差の例

「なっている(na-q/te-i/ru)」,「学校に(ga-q/ko-u/ni)」, 「結婚した(ke-q/ko-N/shi/ta)」を作成するときに使用した音声と音節, および音節の自動ラベルと手動ラベルを表6,表7,表 8に示す. また,それぞれの音声の,自動ラベルおよび手動ラベルを用いた合成音声,自然 音声の波形を図2〜図10に示す.


表 6: 「なっている」に使用する音節の自動ラベルと手動ラベル
音声 用いた 自動 手動  
  音節 ラベル(ms) ラベル(ms)  
なってから(na-q/te-i/ru) na-q 100〜480 100〜493  
もっている(mo-q/te-i/ru) te-i 490〜780 495〜780  
増えている(fu-e/te-i/ru) ru 760〜960 792〜952  

この例では,「増えている」の「ru」の音節開始時間の差において,最大32ms の差があるだけであり,ラベル全体の平均としては,自動ラベルと手動ラベ ルにあまり差がないことが分かる.

また,合成音声「なっている」のオピニオン評価は,手動ラベルでは4.4,自 動ラベルでも4.4と,同等の数値であった.


表 7: 「学校に」に使用する音節の自動ラベルと手動ラベル
音声 用いた 自動 手動  
  音節 ラベル(ms) ラベル(ms)  
学校を(ga-q/ko-u/o) ga-q 100〜500 100〜507  
実行に(ji-q/ko-u/ni) ko-u 470〜840 502〜868  
ほんとうに(ho-N/to-u/ni) ni 840〜1130 856〜1122  

この例では,「実行に」の「ko-u」の音節開始時間の差において,最大32ms の差があるだけであり,ラベル全体の平均としては,自動ラベルと手動ラベ ルにあまり差がないことが分かる.

また,合成音声「学校に」のオピニオン評価は,手動ラベルでは3.8,自動ラ ベルでは3.4であった.


表 8: 「結婚した」に使用する音節の自動ラベルと手動ラベル
音声 用いた 自動 手動  
  音節 ラベル(ms) ラベル(ms)  
結婚する(ke-q/ko-N/su/ru) ke-q 90〜230 100〜431  
結婚して(ke-q/ko-N/shi/te) ko-N 380〜690 415〜687  
逆転した(gya/ku/te-N/shi/ta) shi 730〜920 731〜989  
結束した(ke-q/so/ku/shi/ta) ta 910〜1110 956〜1111  

この例では,「結婚する」の「ke-q」の音節終了時間の差において,最大201ms の差があり,自動ラベルと手動ラベルに大きな差があることが分かる.

また,合成音声「結婚した」のオピニオン評価は,手動ラベルでは3.8,自動 ラベルでは1.4であった.

「なっている(na-q/te-i/ru)」の音声波形を以下に示す.自動ラベルを用い た合成音声を図2,手動ラベルを用いた合成音声を図 3,自然音声の波形を図4に示す.

図 2: 自動ラベル「なっている」
\includegraphics[width=1.0\textwidth,keepaspectratio]{1-1.ps}

図 3: 手動ラベル「なっている」
\includegraphics[width=1.0\textwidth,keepaspectratio]{1-2.ps}

図 4: 自然音声「なっている」
\includegraphics[width=1.0\textwidth,keepaspectratio]{1-3.ps}

2,図3,図4より,「なってい るna-q/te-i/ru」における,自動ラベルおよび手動ラベルを用いた合 成音声,自然音声の音声波形にはそれほど大きな違いはないことが分かる.

「学校に(ga-q/ko-u/ni)」の音声波形を以下に示す.自動ラベルを用い た合成音声を図5,手動ラベルを用いた合成音声を図 6,自然音声の波形を図7に示す.

図 5: 自動ラベル「学校に」
\includegraphics[width=1.0\textwidth,keepaspectratio]{2-1.ps}

図 6: 手動ラベル「学校に」
\includegraphics[width=1.0\textwidth,keepaspectratio]{2-2.ps}

図 7: 自然音声「学校に」
\includegraphics[width=1.0\textwidth,keepaspectratio]{2-3.ps}

5,図6,図7より,「学校に ga-q/ko-u/ni」における,自動ラベルおよび手動ラベルを用いた合成 音声の音声波形にはそれほど大きな違いはないことが分かる.しかし,合成 音声と自然音声を比較すると,合成音声の「ko-u」とni」の接 続部において,若干ではあるが,音量の違いがあることが分かる.

「結婚した(ke-q/ko-N/shi/ta)」の音声波形を以下に示す.自動ラベルを用い た合成音声を図8,手動ラベルを用いた合成音声を図 9,自然音声の波形を図10に示す.

図 8: 自動ラベル「結婚した」
\includegraphics[width=1.0\textwidth,keepaspectratio]{3-1.ps}

図 9: 手動ラベル「結婚した」
\includegraphics[width=1.0\textwidth,keepaspectratio]{3-2.ps}

図 10: 自然音声「結婚した」
\includegraphics[width=1.0\textwidth,keepaspectratio]{3-3.ps}

8,図9,図10より,「結婚した ke-q/ko-N/shi/ta」において,自動ラベルおよび手動ラベルを用いた合成 音声とを比較すると,自動ラベルの「ke-q」の音節継続時間が手動ラベルに比 べ,短いことが分かる.


next up previous contents
次へ: 自動ラベルと手動ラベルの平均の差 上へ: 実験結果 戻る: 実験結果   目次
平成19年3月16日