next up previous contents
次へ: データベースの問題 上へ: 考察 戻る: 5人とも評価の一致した音声   目次

言語クラスタリング法の改善

聴覚実験の結果,言語クラスタリング音声は音響クラスタリング音声 より高い 音声品質を得た.その一方で,ノンクラスタリング音声には及ばなかった.しか し言語クラスタリング音声の音声品質は,今後更に改善される見込みがあると考 えている.

その改善策の1つとして,4.1節の手順4のランダム選択 において,前後音素環境に着目し,音声合成における音素間の相関関係を調査す ることで,より良い音節素片を選択できる可能性がある.そこで合成音声を作成 する際に,いずれかのモーラ位置の音節素片に対して,後音素環境を緩和した音 節素片を用いて合成音声を複数作成し,オピニオン評価実験により得られた値に 応じて音素間の相関を調査した.評価はオピニオンスコアの値において,4以上 の音声には◎,3の音声には○,2以下の音声には×を付与する.なお,◎や○が 重複した場合,×,○,◎の順に優先して付与する.また評価者は,音声研究に 関わった経験のある学生1名とする.調査した結果,得られた音素の相関表を図 26に,作成した合成音声のオピニオン評価実験結果を付録5に示 す.図26において,縦軸が緩和する前の後音素環境,横軸が緩 和した後の後音素環境を示している.

図 26: 音素の相関表
\includegraphics[width=15cm]{correlation.eps}

26において,左上の最も濃い網掛けマスは,母音から母音へ の緩和が行われた結果を示しており,評価×が多く付与されている.左下および 右上の網掛けマスは,子音から母音,母音から子音への緩和が行われた結果を示 しており,場合によっては×が付与されているマスがある.右下の網掛けマスは, 子音から子音への緩和が行われた結果を示しており,◎の評価が非常に多い.ま た一般的に,{p,t,k},{b,d,g},{l,m,n}の各グループ内の音素は,音響的な特 徴が類似しているといわれている.しかし右下の網掛けマスの結果から,特に上 記3種類のグループ内の音素の相関が高いわけではなく,子音同士の相関が高い ことが分かる.

以上より,母音を緩和すると音声品質が劣化することが多く,子音を緩和しても 音声品質に与える影響が少ないと分かった.よって今後は, 4.1節の手順4のランダム選択において,子音が緩和さ れている音節素片を優先的に選択したほうが良いと考えている.



平成21年3月6日