素性
機械学習の素性には表3.1のものを用いる.これらの素性を,対象語が含まれる文から取り出す.
表3.1中に記述されている分類語彙表の番号とは, 分類語彙表によって与えられた語ごとの意味を表す10桁の番号である.
類義語の使い分けでは,文中に存在する語から使い分けに関する情報が得られると考え,素性1を設定する.
その中でも対象語の前後の語に重要な情報があると考え 素性2,3を設定する.
また,対象語の存在する文構造にも情報があると考え,対象語の存在する文節の付属語,
対象語の存在する文節が係る文節,対象語の存在する文節に係る文節の自立語と付属語をそれらの語彙情報とともに素性として設定する(素性4-45).