Stable Baselines Zoo - 学習済みモデルの実行

Stable Baselines Zoo とは、学習済みのモデルを集めたものです。

これを利用することで、学習やパラメータの試行錯誤をすることなく、環境の攻略を試してみることができます。

Stable Baselines Zoo - https://stable-baselines.readthedocs.io/en/master/guide/rl_zoo.html


Stable Baselines Zooのクローン

Stable Baselines Zoo を使うためには、以下のコマンドでリポジトリをクローンします。

1
git clone https://github.com/araffin/rl-baselines-zoo

「rl-baselines-zoo」というフォルダが作成されます。


学習済みモデルによる動作確認

学習済みモデルの動作確認を行うには、「rl-baselines-zoo」フォルダに移動し次のコマンドを実行します。

[コマンド]

1
python enjoy.py --algo ppo2 --env CartPole-v1 --folder trained_agents -n 5000

パラメータの意味は次の通りです。

  • algo
    強化学習アルゴリズム
  • env
    環境ID
  • folder
    ログフォルダ
  • n
    ステップ数

実行すると下記のようなウィンドウが表示され、うまく棒のバランスがとれていることが分かります。

実行結果