今回も、学習率を調整して結果がどう変わるか見ていきたいと思います。
[広くしたマップイメージ]
学習率の微調整2回目
前回の結果より、学習率1.5付近の結果も比較良かったので、さらに学習率1.6から2.5の結果も確認してみます。
ソースの修正箇所は、26-35行目となります。
[ソース]
1 | # 警告を非表示 |
学習率を変更しながら実行し、それぞれの最終結果と平均報酬遷移(グラフ)を確認します。
[結果]
学習率 | 最終位置・最終報酬 | 平均報酬遷移 |
---|---|---|
1.6 | ||
1.7 | ||
1.8 | ||
1.9 | ||
2.0 | ||
2.1 | ||
2.2 | ||
2.3 | ||
2.4 | ||
2.5 |
学習率1.9と2.0は全エピソードの半分くらいゴールしているんですが、完全攻略はできていません。
もう一歩のような気もするんですが・・・😔