「なっている(na-q/te-i/ru)」,「学校に(ga-q/ko-u/ni)」, 「結婚した(ke-q/ko-N/shi/ta)」を作成するときに使用した音声と音節, および音節の自動ラベルと手動ラベルを表6,表7,表 8に示す. また,それぞれの音声の,自動ラベルおよび手動ラベルを用いた合成音声,自然 音声の波形を図2〜図10に示す.
音声 | 用いた | 自動 | 手動 | |
音節 | ラベル(ms) | ラベル(ms) | ||
なってから(na-q/te-i/ru) | na-q | 100〜480 | 100〜493 | |
もっている(mo-q/te-i/ru) | te-i | 490〜780 | 495〜780 | |
増えている(fu-e/te-i/ru) | ru | 760〜960 | 792〜952 |
この例では,「増えている」の「ru」の音節開始時間の差において,最大32ms の差があるだけであり,ラベル全体の平均としては,自動ラベルと手動ラベ ルにあまり差がないことが分かる.
また,合成音声「なっている」のオピニオン評価は,手動ラベルでは4.4,自 動ラベルでも4.4と,同等の数値であった.
音声 | 用いた | 自動 | 手動 | |
音節 | ラベル(ms) | ラベル(ms) | ||
学校を(ga-q/ko-u/o) | ga-q | 100〜500 | 100〜507 | |
実行に(ji-q/ko-u/ni) | ko-u | 470〜840 | 502〜868 | |
ほんとうに(ho-N/to-u/ni) | ni | 840〜1130 | 856〜1122 |
この例では,「実行に」の「ko-u」の音節開始時間の差において,最大32ms の差があるだけであり,ラベル全体の平均としては,自動ラベルと手動ラベ ルにあまり差がないことが分かる.
また,合成音声「学校に」のオピニオン評価は,手動ラベルでは3.8,自動ラ ベルでは3.4であった.
音声 | 用いた | 自動 | 手動 | |
音節 | ラベル(ms) | ラベル(ms) | ||
結婚する(ke-q/ko-N/su/ru) | ke-q | 90〜230 | 100〜431 | |
結婚して(ke-q/ko-N/shi/te) | ko-N | 380〜690 | 415〜687 | |
逆転した(gya/ku/te-N/shi/ta) | shi | 730〜920 | 731〜989 | |
結束した(ke-q/so/ku/shi/ta) | ta | 910〜1110 | 956〜1111 |
この例では,「結婚する」の「ke-q」の音節終了時間の差において,最大201ms の差があり,自動ラベルと手動ラベルに大きな差があることが分かる.
また,合成音声「結婚した」のオピニオン評価は,手動ラベルでは3.8,自動 ラベルでは1.4であった.
「なっている(na-q/te-i/ru)」の音声波形を以下に示す.自動ラベルを用い た合成音声を図2,手動ラベルを用いた合成音声を図 3,自然音声の波形を図4に示す.
図2,図3,図4より,「なってい るna-q/te-i/ru」における,自動ラベルおよび手動ラベルを用いた合 成音声,自然音声の音声波形にはそれほど大きな違いはないことが分かる.
「学校に(ga-q/ko-u/ni)」の音声波形を以下に示す.自動ラベルを用い た合成音声を図5,手動ラベルを用いた合成音声を図 6,自然音声の波形を図7に示す.
図5,図6,図7より,「学校に ga-q/ko-u/ni」における,自動ラベルおよび手動ラベルを用いた合成 音声の音声波形にはそれほど大きな違いはないことが分かる.しかし,合成 音声と自然音声を比較すると,合成音声の「ko-u」とni」の接 続部において,若干ではあるが,音量の違いがあることが分かる.
「結婚した(ke-q/ko-N/shi/ta)」の音声波形を以下に示す.自動ラベルを用い た合成音声を図8,手動ラベルを用いた合成音声を図 9,自然音声の波形を図10に示す.
図8,図9,図10より,「結婚した ke-q/ko-N/shi/ta」において,自動ラベルおよび手動ラベルを用いた合成 音声とを比較すると,自動ラベルの「ke-q」の音節継続時間が手動ラベルに比 べ,短いことが分かる.