強化学習、マルチエージェント強化学習、その他機械学習全般

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

MENU

サーベイ

【強化学習、簡易調査】Reinforcement Learning Experience Reuse with Policy Residual Representation(2019)

※ 本当にざっと読んだだけ 概要 強化学習において、経験の再利用は、サンプルの効率を向上させるために 非常に重要なことである。 重要な課題の1つはどのように経験を表現し、保管するかということである。 これまでの多くの研究では、研究は経験をある特徴…

【マルチエージェント強化学習、簡易調査】Human-level performance in first-person multiplayer games with population-based deep reinforcement learning(2019)

※ 本当にざっと読んだだけ 概要 近年の強化学習の研究では、複雑なシングルエージェントタスクや、 2エージェントタスクにおいて、すばらしい成果を収めてきた。 しかしながら、実際の世界では複数のエージェントが、各々学習し、行動 するような場合が非常…

【マルチエージェント強化学習、簡易調査】Neural Replicator Dynamics

概要 マルチエージェント学習では、 各エージェントの方策が同時に更新されていくため、 本質的に非定常環境となる。 そのため、非定常環境においてもうまく学習できるようなアルゴリズムを開発し 分析することが最優先課題となる。 先行研究で、進化ゲーム…

【マルチエージェント強化学習、簡易調査】Exploration with Unreliable Intrinsic Reward in Multi-Agent Reinforcement Learning

概要 この論文ではマルチエージェント強化学習における探索を補助するために、 不確かな報酬(intrinsic reward)を用いることについて述べる。 我々はintrinsic rewardを協調型のマルチエージェント強化学習に 適用する。 また、intrinsic rewardが、 分散型…

【サーベイ】Bayesian Policy Reuse

概要 すでに、あるタスクにおいて学習済みの方策$\pi$を現在のタスクに適切(より類似した問題を解いた方策)に適用することは非常に重要 この論文では、学習済みの方策$\pi$の集合があり、その中から現在のタスクに最も適した方策を選択する問題を定義 ベイ…

【サーベイ】QMIX:Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning

概要 fully cooperative マルチエージェント強化学習の手法を提案 centralized 行動価値関数(状態と全エージェントの行動により構成される関数)とdecentralised policies(各々のエージェントのpolicy)を持つ形が協調型のマルチエージェント強化学習では知ら…