next up previous contents
Next: 音素ラベリングに使われる一般的知識 Up: No Title Previous: 研究目的

   
過去の研究

手作業で行われている音素ラベリング作業の軽減や、複数の作業者間でのデー タ統一性のため、いろいろな自動ラベリング手法の提案や[6]、 音素ラベリングワークベンチも実際に構成されている[5]。 (音素ラベリングワークベンチとは、音声データベースにおける音素ラベリングデータ の効率的作成・保守のための支援ツール) [6]は、専門家のラベリング作業における処理方法を反映し、専門家がラ ベリングする際に用いる音声に関する知識を有効に活用したシステムで、 このシステムはピッチ周波数、零交差数、パワーの高域周波数成分比、パワー、 ホルマント周波数の音響パラメータ時系列の特徴的変化から音素ラベリングを行 っている。 評価基準は、音素境界位置の誤差が±30ms以内であるものを、全音素境界数からシステ ムが音素境界位置を決定できない音素境界数を除いた数で割ったものを 正解率としてもちいている。 このシステムの実験結果(連続音声データ)の正解率は、97.2となっている。 また、[5]は、 音声データと発話内容を表すローマ字列を入力として自動音素セグメンテーショ ンを行い、 得られた音素ラベル情報(自動ラベル)とラベリング作業に必要な波形、スペクト ログラムなどの音響パラメータが画面に表示され、ラベリング作業者は、音響パ ラメータ、自動ラベルを観察しながら、マウス、キーボードを使用して対話形式 でラベリングを行う。 自動ラベリングでは、HMMによる音素セグメンテーションとスペクトログラム リーディング知識に基づくルール処理により音素セグメンテーションが実行され ている。 ワークベンチを用いたラベリング(単語音声データ)結果は、ハンドラベルにより も止められている音素境界位置と比較して、標準偏差で10.2msであった。

maeta tomohiro
2000-03-16