入力の文章において, 機械学習に基づく手法の 素性番号3(冗長度) の素性の式から冗長度をもとめ, 閾値を設け冗長度が閾値以上の場合のみ冗長な文章と判定する.
閾値は学習データにおける10分割クロスバリデーションの正解率 が高いものを用いる. 閾値は0.4刻みで変更し,最大の正解率付近では0.1刻みで変更して 正解率が最大になる閾値を探索する.