今回は、2012年のデータで学習を行い、2013年のデータで検証してみます。
2012年で学習し2013年で検証
パラメータとしては、前回同様に学習アルゴリズム PPO2 で参照すべき直前データを 100 としています。
1 | import os, gym |
info: {‘total_reward’: 176799.99999998786,
‘total_profit’: 0.9825622859611607,
‘position’: 1}
<br>
<center>
![実行結果](/img/zoo/trade16.png)
</center>
<br>
2012年のデータで学習し、2013年のデータで検証した投資成績は次の通りです。
- トータル報酬 -10,000 → 85,399 → 176,799
- トータル収益 0.7218 → 0.9991 → 0.9825
<br>
これまでの3回の検証の中で、トータル報酬は最もよい投資成績となりました。
2011年、2012年、2013年と順次比較をしてきましたが、現状2勝1敗という結果になっています。