音節波形接続方式は,波形編集型の音声合成方式の一種で,音響パラメータを使用 しないで,言語的なパラメータのみで音声合成を作成する.具体的には,音節波形接続方式で文節を合成する際,収録された大量の音声データベースから以下の情報が一致する音節素片を選択する.
最後に,文節の開始時間と終了時間から波形データを切り出し,接続して合成
音声を作成する[4].
以下に実際に選択した音節素片の例を示す.
例えば『食事の(syo/ku/ji/no)』のという文節の『ji』の音節素片を選択 する場合は,『活字に(ka/tu/ji/ni)』という文節の『ji』の音節素片を選択する. これは中心の音節が『ji』,直前の音素 が『u』,直後の音素が『n』,文節のモーラ位置が『3』,文節のモーラ数が 『4』,文節のアクセント型が『0100型』と,『食事の(syo/ku/ji/no)』の文節と全て一致するためである.