了解度では自然音声も合成音声も同程度の値が得られたが,オピニオンスコアでは自然音声は4.75の対して従来の手法では3.55,そして今回提案した手法でも3.83となり,自然音声には及ばなかった.
オピニオンスコアの評価が悪かった合成音声の多くが接続部での違和感が原因となっていた. それは,音素ごとの微妙な音量の違いから,接続部が強調されてしまい不自然に聞こえたものである.
また,オピニオン評価の音声の種類による比較を下に示す.
自然音声 | 同じ値 | 従来手法 | |
文節数100 | 96 | 2 | 2 |
自然音声 | 同じ値 | 提案手法 | |
文節数100 | 87 | 6 | 7 |
従来手法 | 同じ値 | 提案手法 | |
文節数95 | 20 | 5 | 70 |
この結果を対比較実験と比較すると自然音声の自然性の高さが際立っている.
文節の音声は文の音声の中に埋め込んでこそ意味を持つものであると考え,本研究ではオピニオン評価は比較対象となる文節を自然音声の文の中に埋め込んで行った.
そのため,自然音声の文と比較対象の文節との音量差から,合成音声が不自然に聞こえてしまうことがあった.
そして,合成音声は自然性が低く評価されてしまい,自然音声のオピニオンスコアの値が際立った結果になったと考えられる.