研究室のこと
・htkのインストール
・サーバの停止:他全部のサーバを落としてから最後にgnat,rabbitを停止。
rootになってshutdown -h nowで停止。自動で電源が切れないものは電源ボタンを
押して停止。
・サーバの起動:rabbit,gnatを起動してから他のマシンを起動。
起動は1分の間隔を開けて行う。
・音声のテクニカルターム(かなり怪しくて不完
全)
・音声の対訳語がないテクニカルターム(かなり怪しくて不完全)
・テスト音声データと
パワースペクトラム
・snd(sound editor)
研究で音声を聞くのに使用しているsound editorソフト
音声波形が見られるのならなんでも良いが
・高速フーリエ変換について
参考になるサイト
FFT (高速フーリ
エ・コサイン・サイン変換) の概略と設計法
・高速フーリエ変換のためのC言語ライブラリ
FFTW
1.インストール
上記ホームページからLfftw-3.0.1.tar.gz(現時点)を取ってきて
$ ./configrue
$ make
$ su
$ make install
2.サンプルソース
fftw.c
$ ./fftw < voice.raw
のように実行
3.コンパイル
$ gcc -o fftw fftw.c -lfftw3 -lm
・raw->wave(waveのヘッダー付けるだけのプログラム
sndでもやってくれるがとりあえずここを参考にして作って
みた。
モノラル、16bit、、、(詳しくはソース参照)の音声(ATR Asetのデータ)しか対応していない。
一応サンプリングレートだけ指定できる。
write.c
実行例
$ ./a.out hogehoge.raw hogehoge.wav 16000