本実験では,音声波形をフレーム化処理することによって,信号を切り出された 各フレーム内のパワーの最大値の周波数と同じ周波数上の初期位相を0[rad]にし, 全フレームの初期位相をそろえることにより,初期位相を連続にした.しかし, 位相の標準化を行うことで,フレームは不連続になった.
よって,認識率が低下したのは,従来手法で連続だったフレームが,本研究では, 不連続になったためだと考えられる.
今後は,各フレームを連続に保った状態で,初期位相を標準にして実験を行い, 認識率の向上を期待する.