【マルチエージェント学習、評価用問題】The Gaussian Squeeze Domain

The Gaussian Squeeze Domain(GSD)は完全協調型のマルチエージェントゲームの1つです。
最適化したい目的関数(報酬)は以下の式になります。

$$
\begin{eqnarray}
G(x) = x e^{\frac{-(x- \mu )^{2}}{\delta ^{2}}}
\end{eqnarray}
$$

$\mu$、$\delta$ はシステムの変数となり、この変数の設定によって問題が変化します。
$x$は全エージェントの行動の総和量となります。つまり、
$$
\begin{eqnarray}
x = \sum _{i=0} ^{N}a_i
\end{eqnarray}
$$

nは全エージェントの集合、$a_i$はエージェント$i$の行動を表します。

この問題は完全協調型のマルチエージェントゲームですので、
全エージェントは$G(x)$を報酬として受け取ります。
全エージェントは$G(x)$を最大化するために、うまく協調して、
行動を選択する問題になります。

参考文献

https://www.eecs.wsu.edu/~taylorm/Publications/14IAT.pdf

コメント

タイトルとURLをコピーしました