前回までイーサリアムのデータを使って、強化学習した10種類のうち4種までモデルの検証を行いました。
結果は負け越しが続いてしまったので、今回は学習パラメータを変更し再度学習済みモデルを10種類作成します。
学習済みアルゴリズムはACKTRで、パラメータは次の一覧の通りです。
パラメータ | 設定値 |
---|---|
参照すべき直前のデータ数(window_size) | 10→50→10 |
学習データの開始位置(start_idx) | 10→50→10 |
学習データの終了位置(end_idx) | 510→550→1010 |
訓練ステップ数(timesteps) | 128000 |
学習アルゴリズム | ACKTR |
参照すべき直前のデータ数を50から10に戻し、学習データのスパンを2倍(500→1000)にしています。
学習済みモデルの作成
学習済みモデルを作成するコードは下記の通りになります。
パラメータの内容は、コメント(42~45行目)していますのでご参照下さい。
1 | import os, gym |
上記コードを実行すると、model0.zipからmodel9.zipの10種類の学習済みモデルが作成されます。
次回からはこのモデルでどのような投資成績を出すことができるのかを検証していきます。