tocomの調査録(機械学習、強化学習多め)

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

ナッシュ均衡入門

今回は純粋戦略においてのナッシュ均衡を紹介します。
ちなみに、純粋戦略とはプレーヤーが選択肢の中で、
必ず同じ選択肢を選択し続ける戦略のことを言います。

ナッシュ均衡とは

ナッシュ均衡を一言で言ってしまえば
お互いに相手の予想どおりの戦略を選択することが、
お互いにとって最善の選択になっている状態

のことを言います。

各プレーヤーは現在の戦略を変更する理由が無いため、
(戦略を変更すると得られる利益が減少していまうため)
安定している状態と言えます。
そのため、ゲーム理論ではゲームの一つの解(均衡状態)として、ナッシュ均衡を用います。

イラストで説明

図を用いて説明します。

f:id:ttt242242:20170325085814j:plain

上記のようにプレーヤーが2人いるとします。
各々選択肢(A, B)があるとします。
その時、各プレーヤーが上記のイラストのように、 「お互いに相手の予想どおりの戦略を選択することが、 お互いにとって最善の選択になっている」場合、ナッシュ均衡と言えます。

この例では緑のプレーヤーはAを選択し続け、
白のプレーヤーはBを選択し続けます。

数式で表す

数式で表すと、以下のようになります。

\begin{equation} u_1 (x^* ,y^*) \geq u_1 (x ,y^*) \\ u_2 (x^* ,y^*) \geq u_2 (x^* ,y) \end{equation}

ここで、{u_n} はプレーヤーnの利得。
\( (x^* ,y^*) \) はナッシュ均衡の行動の組み合わせ、
{x(\neq x^*)} ナッシュ均衡の行動 {x^*} 以外の行動を表します。

参考文献

はじめてのゲーム理論 (ブルーバックス)

はじめてのゲーム理論 (ブルーバックス)