next up previous contents
次へ: SO-Scoreのラベル素性 上へ: SVMを用いた情緒推定 戻る: 情緒推定の手順   目次

単語n-gram素性

形態素解析の結果から,n個の単語を直結したものを単語n-gramという.以降,実験条件で表す素性表記は,次のように略称を使う. 略称:W1G,W2G,...W5G

【例】カンペキに逆らってんな、こいつ…。
   W1G:^, W1G:カンペキ, W1G:に,..
   W2G:^カンペキ,..

例にある「^」は仮想記号である.これは,形態素解析後に文頭に「^」,文末に「$」を付与することで,文章のはじまりと 終端を明確にし,単語の意味を区別しやすくするためにつけられている.



平成25年1月15日