2020年になってコロナショックがあり大幅に動いた投資市場ですが、こんなときに強化学習で投資してたらどうなっていたのか気になったので検証してみます。
コロナショック時の投資シミュレーション(PPO2)
まず 、強化学習アルゴリズムとしてはPPO2 を使ってみます。
検証データとしては USDJPYの分足データ を 2020年1月の最初から2020年5年の最後 までを使い、学習データとしては 2019年6月から2019年12月 のデータを使います。
1 | import os, gym |
16行目から21行目でデータのインデックスとデータ数を算出し、24行目で学習データの範囲、48行目で検証データの範囲として指定しています。
FXトレードを実行
上記コードを実行すると次のような結果になります。
[コンソール出力]
1 | info: {'total_reward': -63500.00000002256, |
累積報酬(total_reward)は -63500、純利益(total_profit)は 0.879となりました。
やはり通常状態の相場と違い、大きな暴落がある場合は成績が悪くなるようです。