next up previous contents
次へ: 提案手法に用いる素性 上へ: 提案手法 戻る: SVM法   目次

データ作成

学習データの作成方法は以下に示す. 学習用の文章から2段落対を1組にして抜き出し, その1組の2段落対から元の文章通りの順序(正例)とその逆の順序(負例)の, 2つの事例を作成し,それぞれの事例にどの段落が先か(正解)を示す順序タグを付与する. その後,段落内の情報から各素性を求め(素性作成については5章参照),学習データを作成する.

テストデータも同様に, テスト用の文章から作成する. 学習データ同様の処理を施し,テストデータが作成される. テストデータにも順序タグが付与されるが,SVMの出力との正誤判定に用いる.



平成27年3月4日