機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-05-31から1日間の記事一覧

【強化学習】Potential based Reward Shaping を試してみる

今回はPotential based Reward Shapingをgrid world問題上で試してみます。 Potential based reward shaping 試してみるポテンシャル関数 1.ランダム 2. 学習途中の状態価値$\phi(s)=V(s)$ Grid world problem プログラム 実験結果 Potential based reward s…