次へ:
データ
上へ:
冗長な文の検出1
戻る:
冗長な文の検出1
目次
提案手法
教師あり機械学習[
9
]により各文が冗長な文か否かを判定する.
機械学習の素性として以下のものを用いる.
[
c]使用素性
素性1
単語とその品詞
素性2
単語の品詞
素性3
3文字列
これらの素性は,例えば「マシンの点検を行う」という文では表
4.1
のようになる.
表:
各素性の例(冗長な文の検出1)
素性名
素性の例
素性1(単語)
マシン:名詞, の:助詞, 点検:名詞, ...
素性2(品詞)
名詞, 助詞, ...
素性3(3文字列)
文字列:マシン 文字列:シンの, ...
tsudou 平成24年3月14日