Stable Baselines Zoo には、学習済みモデルを実行している様子を動画ファイルに保存する機能があります。
この機能を使って MinitaurBulletDuckEnv-v0環境 を実行する様子を動画ファイルに出力します。
MinitaurBulletDuckEnv-v0環境 は車輪が3角形の車の上にアヒルが乗っていて、それを落とさないように進まなければいけないちょっと変わった環境です。
(Ubuntu 19.10で動作確認しています。)
学習済みモデルの動画ファイル出力(MinitaurBulletDuckEnv-v0)
次の条件で、学習済みモデルを実行している様子を動画ファイルに出力します。
- 環境
MinitaurBulletDuckEnv-v0 - 学習アルゴリズム
PPO2 - ステップ数
1000
[コマンド]
1 | python3.7 -m utils.record_video --algo ppo2 --env MinitaurBulletDuckEnv-v0 -n 1000 |
上記コマンドを実行すると、次のような動画ファイルが出力されます。
頑張ってるような気もしますが、アヒルは結構落ちてしまっていてもう少し改善してほしい感じです。