next up previous contents
次へ: 2.1で用いた学習データを用いて1で作成したテストデータ内の全ての事例をSVMにより分類 上へ: 手法 戻る: 手法   目次

1.学習データで用いた個々の素性の1個のみの事例を持つテストデータを作成

実験に用いた学習データ内の各事例には多くの素性が付与されている. 事例に付与された多くの素性を素性が1個のみの事例となるように 全ての素性に対して作成し,これらをテストデータとする(図8.1).

学習データ内の各事例の形式は「どちらが先か@推定段落1☆推定段落2 素性」であり, データ内では1行につき1事例が付与されている. 形式内の各項目について以下説明する. 「どちらが先か」は事例に対する正解タグを示し, 「推定段落1」及び「推定段落2」は入力となる推定する2段落の対を表し, 段落1→2の順で入力に与えている.「@」,「☆」,「 (半角スペース)」は 各文字列の区切りを示し,以下素性は1個につき半角スペースでわけている. テストデータ内の形式は「どちらが先か@用いる素性 素性1個」であり, 学習データの形式の各項目同様の部分は省略する. 「@」以降の「用いる素性」はその事例に付与された「素性1個」を示す.

8.1を例にすると, 学習データ内の3事例に付与された10個の素性から 各事例に付与された素性が1個のみとなる事例を10個作成する.

図: 学習データで用いた個々の素性を素性1個のみの事例を持つテストデータ作成
\includegraphics[width=10.5cm]{sosei1.eps}



平成27年3月4日