今回は、2014年のデータで学習を行い、2015年のデータで検証してみます。
2014年で学習し2015年で検証
パラメータとしては、これまで同様に学習アルゴリズム PPO2 で参照すべき直前データを 100 としています。
1 | import os, gym |
info: {‘total_reward’: -59200.00000001036,
‘total_profit’: 0.7990141651909192,
‘position’: 1}
<br>
<center>
![実行結果](/img/zoo/trade18.png)
</center>
<br>
2014年のデータで学習し、2015年のデータで検証した投資成績は次の通りです。
- トータル報酬 -10,000 → 85,399 → 176,799 → -179,400 → -59200
- トータル収益 0.7218 → 0.9991 → 0.9825 → 0.7486 → 0.7990
<br>
前回に引き続き今回も、トータル報酬がマイナスとなってしまいました。
2011年、2012年、2013年、2014年、2015年と順次比較をしてきましたが、現状2勝3敗という結果になっています。