機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

【マルチエージェント学習、評価用問題】The Gaussian Squeeze Domain

The Gaussian Squeeze Domain(GSD)は完全協調型のマルチエージェントゲームの1つです。
最適化したい目的関数(報酬)は以下の式になります。

$$ \begin{eqnarray} G(x) = x e^{\frac{-(x- \mu )^{2}}{\delta ^{2}}} \end{eqnarray} $$

$\mu$、$\delta$ はシステムの変数となり、この変数の設定によって問題が変化します。
$x$は全エージェントの行動の総和量となります。つまり、 $$ \begin{eqnarray} x = \sum _{i=0} ^{N}a_i \end{eqnarray} $$

nは全エージェントの集合、$a_i$はエージェント$i$の行動を表します。

この問題は完全協調型のマルチエージェントゲームですので、
全エージェントは$G(x)$を報酬として受け取ります。
全エージェントは$G(x)$を最大化するために、うまく協調して、
行動を選択する問題になります。

参考文献

https://www.eecs.wsu.edu/~taylorm/Publications/14IAT.pdf