表5に評価試験の結果を示す.なお,ナレータの声質により合 成音声の品質が変わる場合を考慮して,ナレータを変えて同様の方法で評価試 験を行った.ただし,両者の合成音声の発話内容(地名)は,異なる. これらの結果を表5に示す.
|
|
||||||||||||||||||||
ナレータ | ナレータ | 平均 | ナレータ | ナレータ | 平均 | ||||||||||||||||
A | B | A | B | ||||||||||||||||||
|
97.9 | 99.1 | 98.5 | 4.13 | 4.03 | 4.08 | |||||||||||||||
自然音声 | 97.9 | 99.6 | 98.8 | 4.86 | 4.91 | 4.89 | |||||||||||||||
|
90.9 | 94.3 | 92.6 | 1.76 | 1.72 | 1.74 |
評価実験より,本論文で提案した合成音声の単語了解度は,平均98.5%であった. 一方自然音声の単語了解度は,平均98.8%であった.したがって,本論文で提 案した合成音声は,自然音声とほぼ同程度の単語了解度が得られることが示された. 一方,市販の合成音声の単語了解度は平均92.6%であった.したがって,誤り 率からみると,本論文で提案した方法は,市販の合成方法と比較すると,誤り 率が76.7% (100.0-(2.13/9.13)*100) も減少していること がわかる.一方,自然音声と提案した方法を比較すると,誤り率は2.9% (100.0-(2.07/2.13)*100) しか低下しないことが示された.
オピニオン評価では,自然音声が平均4.89であったのに対し,提案手法が平 均4.07と若干低くなった.しかし,市販の合成音声が平均1.74であったことを 考慮すると十分に高い自然性が得られることが示された.
以上のことから,本論文で提案して得た合成音声は,自然音声に近い単語了解度 と自然性を持っていることが示された。