前回は、四足歩行のシミュレーションをランダム行動で実行しましたが、今回は学習させて正しく歩けるようにしてみます。
学習して実行
AntBulletEnv-v0 を学習させるコードは次のようになります。
[コード]
1 | import gym |
学習には時間がかかりますが、学習が成功すると3Dモデルが四足歩行で歩く様子を確認することができます。
前回は、四足歩行のシミュレーションをランダム行動で実行しましたが、今回は学習させて正しく歩けるようにしてみます。
AntBulletEnv-v0 を学習させるコードは次のようになります。
[コード]
1 | import gym |
学習には時間がかかりますが、学習が成功すると3Dモデルが四足歩行で歩く様子を確認することができます。
PyBullet環境 は、オープンソースの3D物理エンジン Bullet で実装された強化学習環境です。
オープンソースのため無料で利用することができます。
PyBullet をインストールするために次のコマンドを実行します。
1 | pip install pybullet |
今回は、四足歩行の3Dモデルを歩かせる AntBulletEnv-v0環境 を利用します。
ランダムで行動するコードは下記のようになります。
[コード]
1 | import gym |
上記コードを実行すると、四足歩行の3Dモデルが表示されます。
ただ今回はランダム実行のため、うまく歩くことはできません。
(Windowsだとうまく動作しなかったので、Ubuntuで動作確認しています。)
Flask を使ったWebサービスで、データベースにアクセスして取得したデータをブラウザに表示する処理を実装していきます。
データベースは MySQL を想定しています。
1 | from flask import Flask, render_template |
データを表示するhtmlファイルのサンプルは下記のとおりです。
(layout.htmlの記載は省略しています。)
1 | {% extends "layout.html" %} |
GymFC は、姿勢制御に重点を置いたフライトコントロール・チューニングフレームワークです。
世界初のニュートラルネットワークでサポートされているフライトコントロール・ファームウェア Nueroflight で使用されるコントローラーの開発にも利用されています。
GymFC - https://github.com/wil3/gymfc
Gym Electric Motor (GEM) は、さまざまなタイプの電気モーターとコンバータを考えて、多種多様な電気ドライブをシミュレートする強化学習環境です。
Gym Electric Motor (GEM) - https://github.com/upb-lea/gym-electric-motor
Donkey Car は、市販のラジコンカーを改造して自律走行させることができるプラットフォームです。
Donkey Car - https://www.donkeycar.com/
gym-donkeycar は、この Donkey Car のシミュレータのGym環境です。
gym-donkeycar - https://github.com/tawnkramer/gym-donkeycar
gym-sokobanは、倉庫の保管場所にすべての荷物を運ぶ倉庫番のゲーム環境です。
DeepMindの論文 Imagination Augmented Agents for Deep Reinforcement Learning で発表されたルールに基づいて実装されています。
gym-sokoban - https://github.com/mpSchrader/gym-sokoban
gym-minigridは、シンプルかつ軽量なグリッドワールド環境です。
各環境はサイズや複雑さがプログラムで調整可能で、カリキュラムの学習や難易度の微調整に便利です。
gym-minigrid - https://github.com/maximecb/gym-minigrid
gym-mazeは、単純な2D迷路環境です。
スタートからゴールまでの最短経路を見つけることが目的となります。
gym-maze - https://github.com/MattChanTK/gym-maze