波形接続型音声合成では,音声合成する音節の接続点を音節境界位置と定義して
いる.音節境界位置は,音節開始時刻と終了時刻が記載されたラベルに基づいて
決定される.図2.1から図2.3にラベルの例を示す.図
2.1は「診察 /shi/N/sa/tsu/」のラベルの例を示している.左から音節
開始時刻,音節終了時刻,音節の名前が記載されており,時刻の単位はミリ秒で
ある.例えば,開始の音節「pau」は無音を示しており,時刻0ミリ秒から時刻
285ミリ秒に含まれている.同様に,図2.2は「威厳 /i/ge/N/」のラベ
ルの例,図2.3は「発音/ha/tsu/o/N/」のラベルの例を示している.ラ
ベルは,人手で作成されている.しかし,波形接続型音声合成用ではなくパラメー
タ合成用であるため,正確に記載されていないという問題点がある.具体的には,
ラベルは人手で作成されており,5ミリ秒間隔で記載されているため,パラメー
タ合成では問題ないが,波形接続方式では精度が足りず,音声品質に問題が生じ
る.
|