next up previous contents
次へ: ラベルの問題 上へ: 考察 戻る: 考察   目次

パワーを求める範囲の問題

実験結果では音節素片全体のパワーを求めている.しかし,音節の発話開始時と 発話終了時の周波数には差が生じる.そのため,パワー最大の周波数に誤差が生 じ,初期位相に誤差が生じる.そこで,発話開始位置近傍の周波数を求める必要 がある.

パワー最大の周波数に誤差が生じ,位相が正しく求まらない例を図 7.1に示す.例として「検挙 /ke/N/kyo/」の「N」の周波数誤差 修正を行わない自動化手法を行った結果の音声波形を示す.時刻0が音節開始位 置である.図7.1を見ると音節開始位置が,振幅が``-''から ``+''に変わるポイントになっていないことがわかる.これは,パワー最大の周 波数に誤差が生じたため,初期位相が正しく算出できなかったためである.

図 7.1: 音声「検挙 /ke/N/kyo/」の「N」に対して離散フーリエ変換を行った音声波形
\fbox{\includegraphics[width=10cm,clip]{fyn11445N512FFT.eps}}

そこで,解決策として音節の開始位置近傍の波形のみを窓長として離散フーリエ 変換を行う.音節開始位置から離散値で64ポイント(約4ms)の窓長で離散フーリ エ変換をおこなった結果を図7.2に示す.

図 7.2: 音声「検挙/ke/N/kyo/」の「N」に対して離散フーリエ変換を行った音 声波形(窓長64ポイント)
\fbox{\includegraphics[width=10cm,clip]{fyn11445N1shuuki.eps}}

7.2では,時刻0において,音声波形の振幅が``-''から ``+''に変わるポイントになっている.したがって,音節開始部の近傍の何周期 かの窓長で離散フーリエ変換を行えば,より初期位相の精度が高まると考えられ る.



平成23年3月16日