次へ:
データ
上へ:
冗長な文の検出2
戻る:
冗長な文の検出2
目次
提案手法
機械学習により特定の表現(対象表現と呼ぶ)を含む文が冗長であるか否かを判定する. 機械学習は,対象表現の種類の数だけ行う.
機械学習の素性として以下のものを用いる.
[
c]使用素性
素性1
文中の対象表現の前後各2単語
素性2
文中の対象表現の前後各2単語の品詞
例えばこれらの素性は「〜与えることは可能である。」の文では表
4.4
のようになる.この例での対象表現は「可能」である.
表:
各素性の例(冗長な文の検出2)
素性名
素性の例
素性1(前後2単語)
こと, は, だ, ある
素性2(前後2品詞)
名詞, 助詞, 助動詞, 助動詞
tsudou 平成24年3月14日