next up previous contents
次へ: 用いる素性 上へ: 提案手法 戻る: SVM法   目次

データ作成

学習データの作成方法は以下に示す. 学習用の文章から連接する2段落対を1組にして抜き出し, 元の文章通りの順序(正順)とその逆の順序(逆順)の, 2つの問題を作成する. その後,段落内の情報から各素性を求め(素性については5章参照),学習データを作成する.

テストデータも同様に, テスト用の文章から作成する.学習データ同様の処理を施し,テストデータが作成される. テストデータにも順序が付与されるが,SVMの出力が正しいかを比較するために用いる.



平成25年2月12日