次へ: デコーダ
上へ: 句に基づく統計翻訳システム
戻る: 言語モデル
目次
N-gramモデル
代表的な言語モデルにN-gramがある.N-gramは「単語の列
84#84
のi番目の単語85#85
の生起確率86#86
は直前の
87#87
単語に依存す」,という仮説に基づくモデルである.計算式を以下に示す.
88#88
例えば, 「I am a teacher .」という文字列に対する2-gram モデルを以下に示す.
89#89
また,3-gramモデルのときは
90#90
になり,4-gramモデルのときは
91#91
になる.このように,(N-1) 単語の次にくる
単語が ``a'' や ``teacher'' である確率を考える.
root
平成24年3月22日