一方,音声合成の対象として小さな単位である単語を合成する場合においては, 地名などの固有名詞では1#1周波数のばらつきが比較的小さく, アクセント型がほぼ一意に決まるため, 1#1周波数とモーラ情報の依存関係を効果的に利用することが可能である[1]. そして,このモーラ情報は音素ラベリング[10]や音声認識[11][12]などの分野において効果があることが報告されている.
しかし,より一般的な普通名詞では例えば「雨」と「飴」のように同音異義語が多数現れるため, モーラ情報を考慮しただけでは不適切な音声素片が選択される場合がある. そして,普通名詞で素片選択においてモーラ情報に加えてアクセント型を考慮した研究[3]が行われており,アクセント型が合成音声の自然性を向上するために有効であることが示されている.
そこで本研究では,文節を対象とした場合に素片選択にモーラ情報とアクセント型を考慮することで,どの程度の合成音声の品質が得られるかを調査する.