いったんコロナショック時での投資は忘れて、通常時の市場での検証を行ってみます。
2010年で学習し2011年で検証
2010年のデータで学習を行い、2011年のデータで検証してみます。
パラメータとしては、コロナショック時のシミュレーションで成績の良かった学習アルゴリズム PPO2 で参照すべき直前データを 100 としています。
1 | import os, gym |
info: {‘total_reward’: -10000.00000005187,
‘total_profit’: 0.7218380064611924,
‘position’: 1}
<br>
<center>
![実行結果](/img/zoo/trade14.png)
</center>
<br>
- トータル報酬 -10000
- トータル収益 0.7218
<br>
なかなかしぶい結果がでました。。。。トータル収益はこれまでの検証で最低の成績かもしれません。
今後は他の期間をいろいろと検証していきたいと思います。