Unity ML-Agentsの学習シナリオ(2)

December 21, 2019

Unity ML-Agentsでは「Agemt」「Brain」「Reward」の組み合わせによっていろいろな学習シナリオを実現することができます。

Cooperative（協同） Multi-Agent
「共有報酬」を受け取る複数のAgentに、１つまたは複数のBrainがリンクされている学習シナリオです。
複数のAgentが協力して１つのタスクを解決します。
（例）部分的な情報にしかアクセスできないAgentが共同でパズルを解く。
Competitive（競争） Multi-Agent
「逆報酬」を受け取る複数チームの敵対した複数のAgentが１つまたは複数のBrainにリンクされている学習シナリオです。
Agentが競争に勝つか、または限られた数のリソースを獲得するために互いに競争します。
（例）サッカーのストライカーとゴールキーパー
Ecosystem（生態系）
「独立報酬」を受け取る複数のAgentが１つまたは複数のBrainにリンクされている学習シナリオです。
さまざまな目標を持つAgentが相互に作用する小さな世界を創造します。
（例）サバンナの中の動物たちの自立シミュレーション