研究室のこと


htkのインストール

・サーバの停止:他全部のサーバを落としてから最後にgnat,rabbitを停止。
rootになってshutdown -h nowで停止。自動で電源が切れないものは電源ボタンを 押して停止。

・サーバの起動:rabbit,gnatを起動してから他のマシンを起動。
起動は1分の間隔を開けて行う。

音声のテクニカルターム(かなり怪しくて不完 全)
音声の対訳語がないテクニカルターム(かなり怪しくて不完全)

テスト音声データ
パワースペクトラム

snd(sound editor)
研究で音声を聞くのに使用しているsound editorソフト
音声波形が見られるのならなんでも良いが

・高速フーリエ変換について
参考になるサイト
FFT (高速フーリ エ・コサイン・サイン変換) の概略と設計法

・高速フーリエ変換のためのC言語ライブラリ
FFTW
1.インストール
上記ホームページからLfftw-3.0.1.tar.gz(現時点)を取ってきて
$ ./configrue
$ make
$ su
$ make install

2.サンプルソース
fftw.c

$ ./fftw < voice.raw
のように実行

3.コンパイル
$ gcc -o fftw fftw.c -lfftw3 -lm


・raw->wave(waveのヘッダー付けるだけのプログラム
sndでもやってくれるがとりあえずここを参考にして作って みた。
モノラル、16bit、、、(詳しくはソース参照)の音声(ATR Asetのデータ)しか対応していない。
一応サンプリングレートだけ指定できる。
write.c

実行例
$ ./a.out hogehoge.raw hogehoge.wav 16000