単語のピッチパターンはアクセント型によらず語頭で上昇したのち語尾に向かっ
て下降する成分とアクセントの位置に対応して上昇・下降する成分の和として
近似できる[7].日本語の単語アクセントは「低高高高低」のよ
うに各音節ごとの高低で表わされるため,各音節のピッチ周波数は単語のモー
ラ数とアクセント型,および音節の単語内における位置で表現できると仮定で
きる.したがって モーラ語であれば理論上
通りのアクセント型が
存在する.
しかし,合成単語の対象が「地名」「姓名」のような固有名詞の場合,アクセ
ント型の出現に偏りがある.実際に 46 モーラの地名を同一話者が発声
した音声から100件ずつランダムに選んで検聴したところ,ほとんどのアクセ
ント型は
型,もしくは
型であった.
さらに,これらの単語音声のピッチ周波数をXwaves+ [9]を用いて 調査した.図1に単一話者が発声した地名 4モーラ語 1,500件 のピッチ周波数の平均値と分散を示す.同様に5モーラ語 2,800件の結果を図 2に,6モーラ語 2,200件の結果を図3に示す.
これらの図において,時間軸はモーラ数で正規化したのち計算した.図中の■
はピッチ周波数の平均値を,縦棒の長さは分散を示している.この結果から,
モーラ数が同じ場合,ピッチ周波数の分散は非常に小さく,アクセント型を意
識しなくて良いと考えた.従って,46 モーラの地名の場合には,各音
節のピッチ周波数は単語のモーラ数と音節のモーラ位置で表現できると仮定し
た.