next up previous contents
次へ: デコーダ 上へ: 句に基づく統計翻訳システム 戻る: 言語モデル   目次


N-gramモデル

代表的な言語モデルにN-gramがある.N-gramは「単語の列 84#84 のi番目の単語85#85 の生起確率86#86 は直前の 87#87 単語に依存す」,という仮説に基づくモデルである.計算式を以下に示す.

88#88

例えば, 「I am a teacher .」という文字列に対する2-gram モデルを以下に示す. 89#89 また,3-gramモデルのときは 90#90 になり,4-gramモデルのときは 91#91 になる.このように,(N-1) 単語の次にくる 単語が ``a'' や ``teacher'' である確率を考える.



root 平成24年3月22日