Stable Baselines Zoo とは、学習済みのモデルを集めたものです。
これを利用することで、学習やパラメータの試行錯誤をすることなく、環境の攻略を試してみることができます。
Stable Baselines Zoo - https://stable-baselines.readthedocs.io/en/master/guide/rl_zoo.html
Stable Baselines Zooのクローン
Stable Baselines Zoo を使うためには、以下のコマンドでリポジトリをクローンします。
1 | git clone https://github.com/araffin/rl-baselines-zoo |
「rl-baselines-zoo」というフォルダが作成されます。
学習済みモデルによる動作確認
学習済みモデルの動作確認を行うには、「rl-baselines-zoo」フォルダに移動し次のコマンドを実行します。
[コマンド]
1 | python enjoy.py --algo ppo2 --env CartPole-v1 --folder trained_agents -n 5000 |
パラメータの意味は次の通りです。
- algo
強化学習アルゴリズム - env
環境ID - folder
ログフォルダ - n
ステップ数
実行すると下記のようなウィンドウが表示され、うまく棒のバランスがとれていることが分かります。