まず,各サブワードモデルを音声データの発話のシンボルが記述されたテキスト を基に連結する. このとき,前のモデルの最終状態が次のモデルの初期状態になる. 次に,Baum-Welchアルゴリズムによって,音声データから連結されたモデルのパラ メータの推定を行う.
連結学習では,初期モデルが重要であり,通常は,ラベル付けされた音声データを用いて初期モデルを作成する. 連結学習の例を図 6 に示す.音声データの音素表記``pau a i pau''を元にして各音素HMMを連結し, 連結したHMMのパラメータを音声データから推定する.