雑多なこと

colab

【入門】Colaboratoryの始め方

Colaboratory(Colab)とは Googleが提供している機械学習用のPython開発環境です。 GPUも無...
colab

【keras-rl,colab】keras-rlをcolabのgpuを用いて実行する

keras-rlをcolab上で動かせるようにしたのでメモしておきます。 Colaboratory(colab) Col...
Transfer Learning

【強化学習、簡易調査】Reinforcement Learning Experience Reuse with Policy Residual Representation(2019)

※ 本当にざっと読んだだけ 概要 強化学習において、経験の再利用は、サンプルの効率を向上させるために 非常に重要なことで...
サーベイ

【マルチエージェント強化学習、簡易調査】Human-level performance in first-person multiplayer games with population-based deep reinforcement learning(2019)

※ 本当にざっと読んだだけ 概要 近年の強化学習の研究では、複雑なシングルエージェントタスクや、 2エージェントタスクに...
サーベイ

【マルチエージェント強化学習、簡易調査】Neural Replicator Dynamics

概要 マルチエージェント学習では、 各エージェントの方策が同時に更新されていくため、 本質的に非定常環境となる。 そのた...
サーベイ

【マルチエージェント強化学習、簡易調査】Exploration with Unreliable Intrinsic Reward in Multi-Agent Reinforcement Learning

概要 この論文ではマルチエージェント強化学習における探索を補助するために、 不確かな報酬(intrinsic rewar...
Transfer Learning

【サーベイ】Bayesian Policy Reuse

概要 すでに、あるタスクにおいて学習済みの方策$\pi$を現在のタスクに適切(より類似した問題を解いた方策)に適用する...
サーベイ

【サーベイ】QMIX:Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

概要 fully cooperative マルチエージェント強化学習の手法を提案 centralized 行動価値関数...
マルチエージェント強化学習

Win or Learn Fast PHC をじゃんけんゲームで実験

同じく、前回の記事でも用いた論文で、 紹介されているWin or Learn Fast PHC(WoLF-PHC)を実装...
ゲーム理論

Policy Hill Climbingエージェントで実験

ランダムエージェントでの実験 Policy Hill Climbing で実験 以下の論文で、紹介されているPolicy...
タイトルとURLをコピーしました