Stable Baselines Zoo - 学習アルゴリズムACERでBeamRiderNoFrameskip-v4を攻略

BeamRiderNoFrameskip-v4 を学習アルゴリズム A2C で攻略します。

BeamRiderNoFrameskip-v4 は、敵をビームで攻撃する単純なシューティングゲームです。

A2C は、A3Cを分散同期にした学習アルゴリズムです。

学習アルゴリズムA2CでBeamRiderNoFrameskip-v4を攻略

学習アルゴリズム A2C の学習済みモデル(Stable Baselines Zoo提供)を使って BeamRiderNoFrameskip-v4 を実行し、その様子を動画ファイルに出力します。


各オプションは以下の通りです。
  • 環境(env)
    BeamRiderNoFrameskip-v4
  • 学習アルゴリズム(algo)
    A2C
  • ステップ数(n)
    1000

[コマンド]

1
python3.7 -m utils.record_video --algo acer --env BeamRiderNoFrameskip-v4 -n 1000

実行結果は次の通りです。(Ubuntu 19.10で動作確認しています。)


実行結果


かなりうまくプレイしています。1面をクリアしててここまでちゃんと攻略してくれると気持ちいいです。