図3.7に誤差修正方法を組み込んだ提案方法のフローチャートを示す.
提案方法を具体的に以下に示す.
ATRのラベルから得られる音節境界位置を用いて音節開始位置・終了位置を得る.
音節素片全体の波長を窓長としてFFT(離散高速フーリェ変換)を行う.FFTによっ
て得られるパワーが最大時の周波数における1周期の波長(ms)を求める.
求めた波長には誤差が含まれるため,1周期の近傍の波長を窓長としてDFT(離散
フーリェ変換)を行う.具体的には,求めた波長を約0.0625ms刻みで最大0.5msま
で増減させ,計17種類の窓長で,音節素片の音節開始位からDFTを行う.
DFTの結果から得られるパワーが最大時の周波数
における初期位相をそ
れぞれの窓長に対して求める.それぞれの初期位相
を
``-
''にするように音節開始位置を変更する.初期位相
``-
''は音声波形の振幅が``-''から``+''に変わる点である.
になる.
また,初期位相
は連続値で扱うので,サンプリング周波数16kHzの音声で
音節開始位置を変更するため,音節開始位置の変更値は約0.0625ms毎の離散値に
なる.それぞれの音節開始位置の中から振幅が最も0に近い音節開始位置を選択
する.