実験結果と考察

5.1節の手法1から手法4で行った実験の正解率を表5.1に示す. 分類先は上昇・下降の2分類であり, 正解率は10分割のクロスバリデーションでもとめた.


表: 各手法での正解率
入力文 正解率
手法1 0.515
手法2 0.711
手法3 0.953
手法4 0.889

5.1からわかるように, 2日前の終値と前日の終値の株価の差を朝刊のタイトルから推定した場合, 正解率が0.515と低くなった. 今回の手法では, 分類先を2分類としたため正解率が0.5近辺となった場合は推定ができていないといえる. これより, 新聞記事のタイトルは前日の株価の変動とは関連性が少ないことが考えられる. 対して「前日比」「前日終値比」を含む段落は前日の株価の変動が記事となったものが多いため, 正解率は高くなった. 同時に「日経平均」を含む段落を入力文としたときはさらに正解率が上がった. これは, 「前日比」「前日終値比」を含む記事では日経平均株価以外の騰落を記事にしたものがあるため, 「日経平均」という単語を追加したことにより, それらの記事が入力文から外れたためだと考えられる.