next up previous contents
次へ: データ 上へ: 冗長な文の検出2 戻る: 冗長な文の検出2   目次


提案手法

機械学習により特定の表現(対象表現と呼ぶ)を含む文が冗長であるか否かを判定する. 機械学習は,対象表現の種類の数だけ行う.

機械学習の素性として以下のものを用いる.

[
c]使用素性
素性1
文中の対象表現の前後各2単語
素性2
文中の対象表現の前後各2単語の品詞
例えばこれらの素性は「〜与えることは可能である。」の文では表4.4のようになる.この例での対象表現は「可能」である.

表: 各素性の例(冗長な文の検出2)
素性名 素性の例
素性1(前後2単語) こと, は, だ, ある
素性2(前後2品詞) 名詞, 助詞, 助動詞, 助動詞




tsudou 平成24年3月14日