手法1, 学習データ1年で行った実験の結果を表6.1に示す. 表6.1の各列は左から順に, 予測を行った年, 各年毎の正解率, データ総数, 利益(total), 損益が最低となったときの値(low), 買い注文の回数, 売り注文の回数, ベースライン手法の利益, ベースライン手法の損益が最低となったときの値である.
同様に手法1, 学習データ5年で行った実験の結果を表6.2に, 手法2, 学習データ1年で行った実験の結果を表6.3に, 手法2, 学習データ5年で行った実験の結果を6.4示す.
表:
手法1(すべての記事のタイトル)学習データ1年
年 |
正解率 |
総数(U,D,N) |
total |
low |
買い |
売り |
buy&hold |
low(b&h) |
08 |
0.339 |
245(90,89,66) |
3193 |
-194 |
28 |
128 |
-6296 |
-7529 |
09 |
0.354 |
242(73,82,87) |
830 |
-60 |
146 |
81 |
1555 |
-1932 |
10 |
0.387 |
243(57,63,123) |
580 |
-154 |
54 |
19 |
-381 |
-1776 |
11 |
0.539 |
245(47,60,138) |
157 |
-102 |
15 |
13 |
-1897 |
-2214 |
12 |
0.577 |
248(53,52,143) |
0 |
0 |
0 |
0 |
1835 |
-271 |
13 |
0.363 |
245(88,69,88) |
595 |
-153 |
9 |
8 |
5687 |
-119 |
14 |
0.336 |
244(51,60,133) |
1237 |
-277 |
106 |
11 |
1303 |
-2178 |
15 |
0.496 |
244(63,52,128) |
-151 |
-162 |
0 |
13 |
1708 |
-517 |
16 |
0.429 |
245(69,65,111) |
-337 |
-727 |
14 |
2 |
296 |
-3866 |
17 |
0.589 |
248(38,33,177) |
115 |
-460 |
48 |
12 |
3466 |
-1059 |
18 |
0.555 |
245(55,54,136) |
0 |
0 |
0 |
0 |
-2959 |
-3711 |
平均 |
0.456 |
|
565 |
|
|
|
392 |
|
表:
手法1(すべての記事のタイトル)学習データ5年
年 |
正解率 |
総数(U,D,N) |
total |
low |
買い |
売り |
buy&hold |
low(b&h) |
12 |
0.444 |
248(53,52,143) |
-395 |
-600 |
32 |
54 |
1835 |
-271 |
13 |
0.343 |
245(88,69,88) |
-2243 |
-2293 |
36 |
12 |
5687 |
-119 |
14 |
0.373 |
244(51,60,133) |
830 |
-21 |
110 |
11 |
1303 |
-2178 |
15 |
0.414 |
244(63,52,128) |
2565 |
-218 |
58 |
71 |
1708 |
-517 |
16 |
0.420 |
245(69,65,111) |
-413 |
-466 |
11 |
13 |
296 |
-3866 |
17 |
0.581 |
248(38,33,177) |
-409 |
-469 |
13 |
26 |
3466 |
-1059 |
18 |
0.453 |
245(55,54,136) |
-29 |
-1168 |
42 |
46 |
-2959 |
-3711 |
平均 |
0.431 |
|
-13 |
|
|
|
1619 |
|
表:
手法2(「前日比」「前日終値比」を含む段落)学習データ1年
年 |
正解率 |
総数(U,D,N) |
total |
low |
買い |
売り |
buy&hold |
low(b&h) |
08 |
0.3143 |
245(90,89,66) |
643 |
-694 |
43 |
35 |
-6296 |
-7529 |
09 |
0.2899 |
242(73,82,87) |
16 |
-602 |
25 |
20 |
1555 |
-1932 |
10 |
0.3820 |
243(57,63,123 |
478 |
-56 |
22 |
27 |
-381 |
-1776 |
11 |
0.3000 |
245(47,60,138) |
178 |
-216 |
20 |
26 |
-1897 |
-2214 |
12 |
0.5686 |
248(53,52,143) |
544 |
0 |
25 |
18 |
1835 |
-271 |
13 |
0.3364 |
245(88,69,88) |
-1615 |
-1627 |
44 |
27 |
5687 |
-119 |
14 |
0.2907 |
244(51,60,133) |
-541 |
-904 |
19 |
20 |
1303 |
-2178 |
15 |
0.4945 |
244(63,52,128) |
1794 |
0 |
24 |
16 |
1708 |
-517 |
16 |
0.3942 |
245(69,65,111) |
-400 |
-996 |
30 |
30 |
296 |
-3866 |
17 |
0.3485 |
248(38,33,177) |
1 |
-307 |
7 |
8 |
3466 |
-1059 |
18 |
0.5135 |
245(55,54,136) |
-182 |
-341 |
12 |
23 |
-2959 |
-3711 |
平均 |
0.3848 |
83 |
-480 |
|
|
|
392 |
|
表:
手法2(「前日比」「前日終値比」を含む段落)学習データ5年
年 |
正解率 |
総数(U,D,N) |
total |
low |
買い |
売り |
buy&hold |
low(b&h) |
12 |
0.441 |
102(25,18,59) |
145 |
-344 |
32 |
18 |
1835 |
-271 |
13 |
0.421 |
107(44,27,36) |
3644 |
-83 |
38 |
21 |
5687 |
-119 |
14 |
0.314 |
86(19,20,47) |
845 |
-499 |
40 |
18 |
1303 |
-2178 |
15 |
0.385 |
91(24,16,51) |
1033 |
-805 |
29 |
12 |
1708 |
-517 |
16 |
0.442 |
104(30,30,44) |
619 |
-861 |
28 |
8 |
296 |
-3866 |
17 |
0.636 |
66(7,8,51) |
147 |
-78 |
5 |
8 |
3466 |
-1059 |
18 |
0.460 |
74(12,23,39) |
-2461 |
-2461 |
19 |
13 |
-2959 |
3771 |
平均 |
0.443 |
|
567 |
|
|
|
1619 |
|
手法1で行った実験の結果を表6.5に, 手法2で行った実験の結果を表6.6にまとめる. 学習データ3年での実験は4章で行ったものである.
表6.1より, 手法1, 学習データ1年で行った実験は利益が出ている年が多かったが取引なしで利益が0となっている年が見られた. これは学習データが少なかったために正しく予測が行えていなかったことが原因と考えられる. また, 表6.5より, 手法1では学習データを5年としたときは, 他のものよりも正解率, 利益ともに低くなっている. よって学習データを増やしすぎても正解率が上がることはない. これは各年ごとで流行や傾向が違うため, 古すぎる情報は株価の予測に役立たないためと考えられる.
手法2では, 学習データを増やすほど利益は多くなっていたが, これは手法1と比較してデータ総数が少なく, 学習データの量が不足していたためと考えられる. また, 学習データを5年以上に増やした場合, これ以上利益が増えることはなかった.
以上より, 学習データは3年近辺が一番予測の性能が高くなることがわかった.
表:
手法1の学習データ別の実験結果
学習データ(年) |
正解率 |
|
|
1 |
0.456 |
565 |
-727 |
3 |
0.451 |
661 |
-1376 |
5 |
0.431 |
-13 |
-2293 |
表:
手法2の学習データ別の実験結果
学習データ(年) |
正解率 |
|
|
1 |
0.385 |
83 |
-1627 |
3 |
0.451 |
279 |
-1775 |
5 |
0.431 |
567 |
-2461 |