前回までで一通り検証を終えたのですが、もう一度だけイーサリアムのデータで学習・検証を行います。
前回結果では、全勝結果が2モデルもありなかなかの好感触だったのですが、ちょっと学習スパンが長すぎたような気がしました。
学習データと検証データが被っていると成績がよくても少々ずるいのではないかと・・・・。
そんなわけで今回は学習データのスパンだけを短く(1000→300)にしてみたいと思います。
学習済みアルゴリズムはACKTRで、パラメータは次の一覧の通りです。
パラメータ | 設定値 |
---|---|
参照すべき直前のデータ数(window_size) | 10→50→10 |
学習データの開始位置(start_idx) | 10→50→10 |
学習データの終了位置(end_idx) | 510→550→1010→310 |
訓練ステップ数(timesteps) | 128000 |
学習アルゴリズム | ACKTR |
学習済みモデルの作成
学習済みモデルを作成するコードは下記の通りになります。
パラメータの内容は、コメント(42~45行目)していますのでご参照下さい。
1 | import os, gym |
上記コードを実行すると、model0.zipからmodel9.zipの10種類の学習済みモデルが作成されます。
次回からはこのモデルでどのような投資成績を出すことができるのかを検証していきます。