next up previous
次へ: HMM 上へ: main 戻る: main

はじめに

現在,音声認識や統計翻訳などの多くの分野でEMアルゴリズムがよく使われて いる.EMアルゴリズム(Expectation-maximization algorithm)[1]は, 確率モデルのパラメータを最尤法に基づいて推定する統計的手法のひとつであ る. EMアルゴリズムは反復法の一種であり,期待値ステップと最大化ステップ を交互に繰り返すことで計算が進行する. 期待値ステップでは,現在推定さ れている潜在変数の分布に基づいて,モデルの対数尤度の期待値を計算する. 最大化ステップでは,期待値ステップで求まった対数尤度の期待値を最大化す るようなパラメータを求める.最大化ステップで求まったパラメータは,次の 期待値ステップで使われる潜在変数の分布を決定するために用いられる.

音声認識においてはEMアルゴリズムの1つとして,Baum-Welchアルゴリズム [2]がよく利用される.数学的なアルゴリズムは,X.D.Huangら,もし くは Steve Youngらによって詳細に記述されている [3][4]. またSteve YoungらにおいてBaum-Welchアルゴリズムのソースが公開されている [4].このソースを利用することで,実際の動きが理解できる.

しかし,これら[3][4]に記述されているアルゴリズムは,数 式で表現されているため,音声認識の研究を始めたばかりの初心者にとって動 作がわかりにくい.そこでこの解説論文では,音声認識の研究/開発の初心者 や統計的推定法の基本アルゴリズムを改めて理解したい方を対象 に,Baum-Welchアルゴリズムの動作を直感的に理解できるように,簡単な具体 例を使ってステップごとに解説する.

本論文の全体の構成を以下に示す. 2.章においては,HMM(隠れマ ルコフモデル Hidden Markov Model)のパラメータについて説明する. [*]章においては,HMMのパラメータが与えられたときの入力シンボ ル系列の尤度の計算方法と,音声認識の方法について述べる. [*]章では,認識のためのHMMのパラメータに説明する. [*]章では,HMMのパラメータの学習方法であ るBaum-Welchアルゴリズムについて説明する. 最後に[*]章では,Baum-Welchアルゴリズムの,言語モデルへの 適応例や,他の分野への応用例を紹介する.そして,このアルゴリズムの拡張 について示すとともに,問題点についても述べる.



Jin'ichi Murakami 平成22年9月2日