機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-05-01から1日間の記事一覧

【Open AI gym、強化学習】MoutainCar(連続値)の紹介

前回の記事でMoutainCar問題を紹介しました。 www.tcom242242.net 今回はMoutainCarの制御値が連続値のバージョンを紹介します。 問題の概要 制御値、観測、報酬等について 制御値(行動) 観測 報酬 エピソードの終了判定 ちょっと動かしてみる サンプルコ…