next up previous contents
次へ: データ 上へ: 冗長な文の検出1 戻る: 冗長な文の検出1   目次


提案手法

教師あり機械学習[9]により各文が冗長な文か否かを判定する.

機械学習の素性として以下のものを用いる.
[
c]使用素性
素性1
単語とその品詞
素性2
単語の品詞
素性3
3文字列
これらの素性は,例えば「マシンの点検を行う」という文では表4.1のようになる.

表: 各素性の例(冗長な文の検出1)
素性名 素性の例
素性1(単語) マシン:名詞, の:助詞, 点検:名詞, ...
素性2(品詞) 名詞, 助詞, ...
素性3(3文字列) 文字列:マシン 文字列:シンの, ...



tsudou 平成24年3月14日