次へ: 用いる素性
上へ: 提案手法
戻る: 2文の順序推定方法
目次
データ作成
学習データは以下のようにして作成する.
学習用の文章から2文を1組にして抜き出す.
その2文から,元の文章通りの正しい順序(正順)の2文と
その逆の順序(逆順)の2文を作成する.
正順の2文を正例,逆順の2文を負例として,
学習データを作成する.
この時,正例に2文には正例であることを表すタグを付与する.
負例の場合も同様に負例であることを表すタグを付与する.
その後,文に含まれる情報を抜きだし,各素性を求める(素性については節参照).
テストデータも同様に,
テスト用の文章から作成する.
学習データ同様正例,もしくは負例のタグが付与されるが,
テストデータの場合,これらのタグはSVMの出力が正しいかを評価するために用いる.
平成25年10月13日