実験結果

手法1, 学習データ1年で行った実験の結果を表6.1に示す. 表6.1の各列は左から順に, 予測を行った年, 各年毎の正解率, データ総数, 利益(total), 損益が最低となったときの値(low), 買い注文の回数, 売り注文の回数, ベースライン手法の利益, ベースライン手法の損益が最低となったときの値である. 同様に手法1, 学習データ5年で行った実験の結果を表6.2に, 手法2, 学習データ1年で行った実験の結果を表6.3に, 手法2, 学習データ5年で行った実験の結果を6.4示す.




表: 手法1(すべての記事のタイトル)学習データ1年
正解率 総数(U,D,N) total low 買い 売り buy&hold low(b&h)
08 0.339 245(90,89,66) 3193 -194 28 128 -6296 -7529
09 0.354 242(73,82,87) 830 -60 146 81 1555 -1932
10 0.387 243(57,63,123) 580 -154 54 19 -381 -1776
11 0.539 245(47,60,138) 157 -102 15 13 -1897 -2214
12 0.577 248(53,52,143) 0 0 0 0 1835 -271
13 0.363 245(88,69,88) 595 -153 9 8 5687 -119
14 0.336 244(51,60,133) 1237 -277 106 11 1303 -2178
15 0.496 244(63,52,128) -151 -162 0 13 1708 -517
16 0.429 245(69,65,111) -337 -727 14 2 296 -3866
17 0.589 248(38,33,177) 115 -460 48 12 3466 -1059
18 0.555 245(55,54,136) 0 0 0 0 -2959 -3711
平均 0.456   565       392  




表: 手法1(すべての記事のタイトル)学習データ5年
正解率 総数(U,D,N) total low 買い 売り buy&hold low(b&h)
12 0.444 248(53,52,143) -395 -600 32 54 1835 -271
13 0.343 245(88,69,88) -2243 -2293 36 12 5687 -119
14 0.373 244(51,60,133) 830 -21 110 11 1303 -2178
15 0.414 244(63,52,128) 2565 -218 58 71 1708 -517
16 0.420 245(69,65,111) -413 -466 11 13 296 -3866
17 0.581 248(38,33,177) -409 -469 13 26 3466 -1059
18 0.453 245(55,54,136) -29 -1168 42 46 -2959 -3711
平均 0.431   -13       1619  




表: 手法2(「前日比」「前日終値比」を含む段落)学習データ1年
正解率 総数(U,D,N) total low 買い 売り buy&hold low(b&h)
08 0.3143 245(90,89,66) 643 -694 43 35 -6296 -7529
09 0.2899 242(73,82,87) 16 -602 25 20 1555 -1932
10 0.3820 243(57,63,123 478 -56 22 27 -381 -1776
11 0.3000 245(47,60,138) 178 -216 20 26 -1897 -2214
12 0.5686 248(53,52,143) 544 0 25 18 1835 -271
13 0.3364 245(88,69,88) -1615 -1627 44 27 5687 -119
14 0.2907 244(51,60,133) -541 -904 19 20 1303 -2178
15 0.4945 244(63,52,128) 1794 0 24 16 1708 -517
16 0.3942 245(69,65,111) -400 -996 30 30 296 -3866
17 0.3485 248(38,33,177) 1 -307 7 8 3466 -1059
18 0.5135 245(55,54,136) -182 -341 12 23 -2959 -3711
平均 0.3848 83 -480       392  




表: 手法2(「前日比」「前日終値比」を含む段落)学習データ5年
正解率 総数(U,D,N) total low 買い 売り buy&hold low(b&h)
12 0.441 102(25,18,59) 145 -344 32 18 1835 -271
13 0.421 107(44,27,36) 3644 -83 38 21 5687 -119
14 0.314 86(19,20,47) 845 -499 40 18 1303 -2178
15 0.385 91(24,16,51) 1033 -805 29 12 1708 -517
16 0.442 104(30,30,44) 619 -861 28 8 296 -3866
17 0.636 66(7,8,51) 147 -78 5 8 3466 -1059
18 0.460 74(12,23,39) -2461 -2461 19 13 -2959 3771
平均 0.443   567       1619  

手法1で行った実験の結果を表6.5に, 手法2で行った実験の結果を表6.6にまとめる. 学習データ3年での実験は4章で行ったものである.

6.1より, 手法1, 学習データ1年で行った実験は利益が出ている年が多かったが取引なしで利益が0となっている年が見られた. これは学習データが少なかったために正しく予測が行えていなかったことが原因と考えられる. また, 表6.5より, 手法1では学習データを5年としたときは, 他のものよりも正解率, 利益ともに低くなっている. よって学習データを増やしすぎても正解率が上がることはない. これは各年ごとで流行や傾向が違うため, 古すぎる情報は株価の予測に役立たないためと考えられる. 手法2では, 学習データを増やすほど利益は多くなっていたが, これは手法1と比較してデータ総数が少なく, 学習データの量が不足していたためと考えられる. また, 学習データを5年以上に増やした場合, これ以上利益が増えることはなかった. 以上より, 学習データは3年近辺が一番予測の性能が高くなることがわかった.



表: 手法1の学習データ別の実験結果
学習データ(年) 正解率
1年間の
平均利益(円)
1年間の損失
最大値(円)
1 0.456 565 -727
3 0.451 661 -1376
5 0.431 -13 -2293




表: 手法2の学習データ別の実験結果
学習データ(年) 正解率
1年間の
平均利益(円)
1年間の損失
最大値(円)
1 0.385 83 -1627
3 0.451 279 -1775
5 0.431 567 -2461