The Gaussian Squeeze Domain(GSD)は完全協調型のマルチエージェントゲームの1つです。
最適化したい目的関数(報酬)は以下の式になります。
$$
\begin{eqnarray}
G(x) = x e^{\frac{-(x- \mu )^{2}}{\delta ^{2}}}
\end{eqnarray}
$$
$\mu$、$\delta$ はシステムの変数となり、この変数の設定によって問題が変化します。
$x$は全エージェントの行動の総和量となります。つまり、
$$
\begin{eqnarray}
x = \sum _{i=0} ^{N}a_i
\end{eqnarray}
$$
nは全エージェントの集合、$a_i$はエージェント$i$の行動を表します。
この問題は完全協調型のマルチエージェントゲームですので、
全エージェントは$G(x)$を報酬として受け取ります。
全エージェントは$G(x)$を最大化するために、うまく協調して、
行動を選択する問題になります。
参考文献
https://www.eecs.wsu.edu/~taylorm/Publications/14IAT.pdf
コメント
[…] https://www.tcom242242.net […]
[…] https://www.tcom242242.net […]