Agentが観測した状態に応じて、行動を決定するオブジェクトとなります。
1つのBrainで複数のAgentsの行動を決定することもできます。
Brainには下記の4種類があります。
1.External
外部の自作MLライブラリ(Tensorflowなど)を使用します。
学習時に設定されます。
2.Internal
プロジェクトに埋め込まれた推論モデルを使用します。
推論時に設定されます。
3.Player
プレイヤー(人間)の入力に従って行動します。
学習環境の動作確認時などに利用します。
4.Heuristic
ルールベース(プログラム)に従って行動します。