前回作成した学習済みモデルの成績が良くなかったので、新しい学習済みモデルを作成していきます。
アルゴリズムをPPO2から、ACKTRに戻してみます。(PPO2の成績がほんとに悪かったもので・・・)
学習のためのパラメータをまとめると次の一覧のようになります。
パラメータ | 設定値 |
---|---|
参照すべき直前のデータ数(window_size) | 30 |
学習データの開始位置(start_idx) | 100 |
学習データの終了位置(end_idx) | 300 |
訓練ステップ数(timesteps) | 128000 |
学習アルゴリズム | ACKTR |
学習済みモデルの作成
学習済みモデルを作成するコードは下記の通りになります。
パラメータの内容は、コメントしていますのでご参照下さい。
1 | import os, gym |
上記コードを実行すると、model0.zipからmodel9.zipの10種類の学習済みモデルが作成されます。
次回からはこのモデルでどのような投資成績を出すことができるのかを検証していきます。