これまでビットコインの 1時間足 のデータで投資シミュレーションを行ってきましたが、今回からは 1日足 での検証を行ってみます。
強化学習のパラメータ
ソースはこれまでの応用なので割愛し、強化学習のパラメータだけを下記に示します。
- 学習アルゴリズム
PPO2 - 参照する直前データ数
50 - 学習データ
[2017-07-13 ~ 2018-05-11] 1日足データ - 検証データ
[2018-05-12 ~ 2019-03-07] 1日足データ
投資結果
実行結果は以下の通りです。
[コンソール出力]
1 | info: {'total_reward': 737820000.0, 'total_profit': 1.5204328969406768, 'position': 0} |
[出力画像]
投資結果(トータル報酬)を表にまとめてみます。
No. | トータル報酬(前回) |
---|---|
① | 737,820,000円 |
② | 4,451,760,000円 |
③ | 4,724,240,000円 |
④ | -3,133,420,000円 |
⑤ | 7,880,400,000円 |
⑥ | 2,833,180,000円 |
⑦ | 2,268,160,000円 |
⑧ | 1,437,600,000円 |
⑨ | -3,185,920,000円 |
⑩ | -5,817,080,000円 |
10種類の学習済みモデルの結果は7勝3敗です。
これからは、今回作成した学習済みモデルを使い期間を変えて投資結果を検証していきます。