評価用問題

マルチエージェント強化学習

【マルチエージェント強化学習問題】pursuit problem(追跡問題)

pursuit problem(追跡問題) 強化学習エージェント(predator)の行動、状態、報酬 行動 状態 報酬 実験 ソースコード 実行結果 参考文献 pursuit problem(追跡問題) pursuit pro...
マルチエージェント強化学習

【マルチエージェント強化学習、評価用問題】Boutiler’s Coordination Game

今回はBoutiler's Coordination Gameを紹介します。 このゲーム2体のエージェントの協調型のゲームになります。 つまり、うまく協調した時にお互いに最大の報酬が得られるような問題となります。 この問題の状態遷移と報酬に...
マルチエージェント強化学習

【マルチエージェント学習、評価用問題】The Gaussian Squeeze Domain

The Gaussian Squeeze Domain(GSD)は完全協調型のマルチエージェントゲームの1つです。 最適化したい目的関数(報酬)は以下の式になります。 $$ \begin{eqnarray} G(x) = x e^{\fra...
タイトルとURLをコピーしました