強化学習、マルチエージェント強化学習、その他機械学習全般

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

MENU

評価用問題

【マルチエージェント強化学習、評価用問題】Boutiler's Coordination Game

今回はBoutiler's Coordination Gameを紹介します。 このゲーム2体のエージェントの協調型のゲームになります。 つまり、うまく協調した時にお互いに最大の報酬が得られるような問題となります。 この問題の状態遷移と報酬については以下の図のようになりま…

【マルチエージェント学習、評価用問題】The Gaussian Squeeze Domain

The Gaussian Squeeze Domain(GSD)は完全協調型のマルチエージェントゲームの1つです。 最適化したい目的関数(報酬)は以下の式になります。 $$ \begin{eqnarray} G(x) = x e^{\frac{-(x- \mu )^{2}}{\delta ^{2}}} \end{eqnarray} $$ $\mu$、$\delta$ はシ…