next up previous contents
次へ: 実験に用いる同義語対 上へ: 問題設定と提案手法 戻る: 最大エントロピー法   目次


素性

文献[2]を参考にし,機械学習の素性には表3.1のものを用いる. これらの素性を,対象語が含まれる文から取り出す. 表3.1中に記述されている分類語彙表の番号とは, 分類語彙表によって与えられた語ごとの意味を表す10桁の番号である. 同義語の使い分けでは,文中に存在する語から使い分けに関する情報が得られると考え, 素性1を設定する. その中でも対象語の前後の語に重要な情報があると考え 素性2,3を設定する. また,対象語の存在する文構造にも情報があると考え, 対象語の存在する文節の付属語,対象語の存在する文節が係る文節, 対象語の存在する文節に係る文節の自立語と付属語をそれらの語彙情報とともに素性として設定する(素性4-45).


表: 同義語の判別に用いる素性
20#20




平成25年2月19日