言語モデルとして代表的なものにN-gramモデルがある.N-gramモデ ルは,``単語列 のi番目の単語 の生 起確率 は直前の 単語に依存する'',という仮説に基づくモデ ルである. 計算式を以下に示す.
(3) |
例えば,「He is japanese .」という文字列に対する2-gramモデルは以下のよう になる.
(4) |
3-gramであれば「He is」という2単語の次に来る単語が「japanese」である確率 を考える.音声認識では,一般に3-gramモデルが広く用いられており,高い効果を示し ている.