gym

gym

Open AI Gymの調査録

Environments CartPole MoutainCar(離散値) MoutainCar(連続値) Acrobot Pendulum
gym

【open ai gym、強化学習】Acrobotの紹介

今回はAcrobotについて紹介します。 問題の概要 Acrobotは下のイメージ図にあるように 2つのリンクが中間点によって繋がっている振り子をコントロールする問題です。 出典:Leaderboard · openai/gym Wiki...
gym

【Open AI gym、強化学習】Pendulumの紹介

問題の概要 Pendulumは、 単振り子の問題になります。 以下の振り子に適切な力を加え、 振り子を立たせることが目的となる問題です。 出典:Leaderboard · openai/gym Wiki · GitHub 制御値、観測、報...
gym

【Open AI gym、強化学習】MoutainCar(連続値)の紹介

前回の記事でMoutainCar問題を紹介しました。 今回はMoutainCarの制御値が連続値のバージョンを紹介します。 問題の概要 MoutainCarは、 台車を山の上にあるゴール地点にたどり着けるように 適切にコントロールする問題...
gym

【Open AI gym、強化学習】MoutainCarの紹介

問題の概要 MoutainCarは、 台車を山の上にあるゴール地点にたどり着けるように 適切にコントロールする問題になります。 出典:Leaderboard · openai/gym Wiki · GitHub 制御値、観測、報酬等につい...
gym

【Open AI gym、強化学習】CartPoleの紹介

問題の概要 CartPoleは、 棒が設置してある台車があり、 台車を棒が倒れないように うまくコントロールする問題になります。 出典:Leaderboard · openai/gym Wiki · GitHub 制御値、観測、報酬等につ...
タイトルとURLをコピーしました