単語のピッチパターンはアクセント型によらず語頭で上昇したのち語尾に向かっ て下降する成分とアクセントの位置に対応して上昇・下降する成分の和として 近似できる[7].日本語の単語アクセントは「低高高高低」のよ うに各音節ごとの高低で表わされるため,各音節のピッチ周波数は単語のモー ラ数とアクセント型,および音節の単語内における位置で表現できると仮定で きる.したがって モーラ語であれば理論上 通りのアクセント型が 存在する.
しかし,合成単語の対象が「地名」「姓名」のような固有名詞の場合,アクセ ント型の出現に偏りがある.実際に 46 モーラの地名を同一話者が発声 した音声から100件ずつランダムに選んで検聴したところ,ほとんどのアクセ ント型は 型,もしくは 型であった.
さらに,これらの単語音声のピッチ周波数をXwaves+ [9]を用いて 調査した.図1に単一話者が発声した地名 4モーラ語 1,500件 のピッチ周波数の平均値と分散を示す.同様に5モーラ語 2,800件の結果を図 2に,6モーラ語 2,200件の結果を図3に示す.
これらの図において,時間軸はモーラ数で正規化したのち計算した.図中の■ はピッチ周波数の平均値を,縦棒の長さは分散を示している.この結果から, モーラ数が同じ場合,ピッチ周波数の分散は非常に小さく,アクセント型を意 識しなくて良いと考えた.従って,46 モーラの地名の場合には,各音 節のピッチ周波数は単語のモーラ数と音節のモーラ位置で表現できると仮定し た.