next up previous contents
次へ: 用いる素性 上へ: 提案手法 戻る: 2文の順序推定方法   目次


データ作成

学習データは以下のようにして作成する. 学習用の文章から2文を1組にして抜き出す. その2文から,元の文章通りの正しい順序(正順)の2文と その逆の順序(逆順)の2文を作成する. 正順の2文を正例,逆順の2文を負例として, 学習データを作成する. この時,正例に2文には正例であることを表すタグを付与する. 負例の場合も同様に負例であることを表すタグを付与する. その後,文に含まれる情報を抜きだし,各素性を求める(素性については[*]節参照).

テストデータも同様に, テスト用の文章から作成する. 学習データ同様正例,もしくは負例のタグが付与されるが, テストデータの場合,これらのタグはSVMの出力が正しいかを評価するために用いる.



平成25年10月13日