next up previous contents
次へ: 実験 上へ: 研究の着目点 戻る: 位相情報とは   目次

本研究で提案する特徴量

本研究で提案する特徴量は,入力となる音声波形に対して離散フーリェ変換を行 い,実数成分(Real)と虚数成分(Img)の値を,独立した情報として用いる.具体 的には,式13に対してオイラーの公式 ( $e^{j\theta} = cos\theta + jsin\theta$)を用いて,次のように扱う.


\begin{displaymath}
実数成分(Real) = \sum^{N-1}_{n=0} Input(n)\times \cos\theta \\
\end{displaymath} (14)


\begin{displaymath}
虚数成分(Img) = \sum^{N-1}_{n=0} Input(n)\times (-\sin\theta ) \\
\end{displaymath} (15)

次に出力波形の例を示す.入力として音声「a」の1フレームを図 5に示す.

図 5: 音声波形「a」の1フレーム
\includegraphics[width=90mm]{onsei_a.eps}

絶対値をとったパワースペクトルを図 6に,提案する特徴量として,実数成分を図7に, 虚数成分を図8に示す.

図 6: パワースペクトル(FFTpower)
\includegraphics[width=80mm]{fftpower.eps}

図 7: フーリェ変換後の実数成分
\includegraphics[width=80mm]{real.eps}
図 8: フーリェ変換後の虚数成分
\includegraphics[width=80mm]{img.eps}

パワースペクトルは実数成分と虚数成分の値の絶対値であ る.提案する特徴量は,二つの情報を独立して用いることで,位相情報を含めた 値となる.位相情報を含んでいる点がパワースペクトルとは異 なる.本研究ではこの特徴量をFFT_Real_Imgと呼ぶ.



平成25年10月13日