Unity ML-Agentsでは「Agemt」「Brain」「Reward」の組み合わせによっていろいろな学習シナリオを実現することができます。
- Single-Agent
1つのAgentに1つのBrainがリンクされている学習シナリオです。
一番シンプルなシナリオで、シングルプレイヤーゲームがこれにあたります。 - Simultaneous(同時) Sigle-Agent
「独立報酬」をもらう複数のAgentが1つのBrainにリンクされている学習シナリオです。
Single-Agentの並列化バージョンで、スピードアップと安定化ができるようになります。
ナルトが多重影分身で修行しているような感じです。 - Adversarial(敵対) Self-Play
「逆報酬」をもらう敵対した2つのAgentが1つのBrainにリンクされている学習シナリオです。
2人プレイのゲームでAgent同士を対戦させることで学習を行うようなケースがこれに適応します。
(例)テニスのプレイヤー