(2.18) |
例えば,「I am a sturdent .」という文字列に対する2-gramモデルを以下に示す.
3-gramモデルであれば,4-gramモデルであれば というように,(N - 1)単語の次にくる単語が「a」,「student」である確率を考える.
しかし,-gramモデルは局所的な情報であり,文法構造の情報を持たない.例えば日英統計翻訳のような異なる文法構造間の翻訳は,日本語から英語へ文法構造が変化するため,同じ文法構造間の翻訳と比較して,翻訳精度が低下する傾向となる.