PythonとRPAで遊ぶ

Menu Close
  • Home
  • Archives

強化学習3 (シミュレータ)

9月 9, 2019

強化学習では、戦略を重視するか(Policyベース)、価値を重視するか(Valueベース)が重要なポイントとなります。
この2つをシミュレーションするサンプルがありましたので実行してみました。

参考

Pythonで学ぶ強化学習 -入門から実践まで- サンプルコード

  • Python

Newer
強化学習4 (経験から計画を立てる)
Older
強化学習2 (マルコフ決定過程)
Contents
    None

 
 
 


© 2023 PythonとRPAで遊ぶ All Rights Reserved.
Theme by hipaper