音声は録音した時間帯が近い場合には音量や発話速度が同程度となると考えられる. そして,録音した時間帯が近い音声素片で合成音声を作成した場合,音声合成に使用する音声素片の音量や発話速度のばらつきが抑えられると考えられる. そこで,本研究で使用する音声コーパスは録音した順番が分かっているため,選択条件に一致した音声素片の侯補の中で録音した時間帯が近い素片を選択し合成音声を作成する.
本研究で使用する音声データベースは,音声が録音した順番に文番号が割り当てられている. そこで,音声素片全体の音量や発話速度を均一化する具体的な絞り込み手法として,音声素片の含まれる文の文番号の値の偏差が小さい素片の組み合せを選択し,音声を作成する.