本研究で提案する特徴量は,入力となる音声波形に対して離散フーリェ変換を行 い,実数成分(Real)と虚数成分(Img)の値を,独立した情報として用いる.具体 的には,式13に対してオイラーの公式 ( )を用いて,次のように扱う.
(14) |
(15) |
次に出力波形の例を示す.入力として音声「a」の1フレームを図 5に示す.
絶対値をとったパワースペクトルを図 6に,提案する特徴量として,実数成分を図7に, 虚数成分を図8に示す.
パワースペクトルは実数成分と虚数成分の値の絶対値であ
る.提案する特徴量は,二つの情報を独立して用いることで,位相情報を含めた
値となる.位相情報を含んでいる点がパワースペクトルとは異
なる.本研究ではこの特徴量をFFT_Real_Imgと呼ぶ.