12月31日の記事にてアルゴリズムACKTRでイーサリアムの学習済みモデルを10種類作成しました。
そのすべてのモデルに対して、30回連続で投資検証を行った結果をまとめてみます。
結果
| 学習済みモデル | 勝敗数 |
|---|---|
| 0番目 | 12勝9敗 |
| 1番目 | 12勝9敗 |
| 2番目 | 12勝9敗 |
| 3番目 | 12勝9敗 |
| 4番目 | 4勝16敗1分 |
| 5番目 | 12勝9敗 |
| 6番目 | 12勝9敗 |
| 7番目 | 12勝9敗 |
| 8番目 | 12勝9敗 |
| 9番目 | 4勝17敗 |
今回作成した10種類の学習済みモデルうち8種類の投資成績が12勝9敗と個体差の少ない学習モデルだったことが分かりました。
その他2モデルの結果は4勝16敗1分、4勝17敗と大きく負け越してしまいました。
同じ学習パラメータを使ってビットコインのデータを学習した際には、学習済みモデルごとにもっと個体差があったので、学習パラメータと学習データによって作成されるモデルには個体差がでやすかったりでにくかったりすることが分かりました。
強化学習のスキルを向上させようといろいろ試していますが、試行を重ねると理解が深まるような気もしますし、さらに深い闇に迷ってしまっているような気もします。。。(;^_^A