ノート

強化学習関連のこと

MENU

ゲーム理論

【ゲーム理論】【マルチエージェント学習】Two Player Two Action ゲームの具体的な利得テーブルまとめ

Common interest game 1,2 a b a 1.0,1.0 0.0,0.0 b 0.0,0.0 0.5,0.5 Coordination game 1,2 a b a 1.0,0.5 0.0,0.0 b 0.0,0.0 0.5,1.0 Stag hunt game 1,2 a b a 1.0,1.0 0.0,0.75 b 0.75,0.0 0.5,0.5 Tricky game 1,2 a b a 0.0,1.0 1.0,0.67 b 0.33,0.0 0…

Policy Hill Climbingエージェントで実験

ランダムエージェントでの実験 Policy Hill Climbing で実験 以下の論文で、紹介されているPolicy Hill Climbing(PHC) http://www.cs.cmu.edu/~mmv/papers/01ijcai-mike.pdf を実装して実験してみました。 問題設定 よくゲーム理論で用いられているものです…

囚人のジレンマをランダムエージェントで実験

実験もくそもないけど、ちょっと実装してみます。 強化学習エージェントで実装する前にランダムエージェントで、 報酬関数が囚人のジレンマのゲームをやってみます。 問題設定 よくゲーム理論で用いられているものです。 1,2 協調(C) 裏切り(D) 協調(C) 6, 6…

【ゲーム理論】2人2行動ゲームの分類

代表的なゲームの分類 2 player 2 action gameをいくつか挙げてまとめておきます。 まず、以下の利得表を使って、囚人のジレンマ、チキン・ゲーム、ハトタカゲーム、コーディネーションゲームを書いておきます。 1,2 協調(C) 裏切り(D) 協調(C) R,R S,T 裏切…

二人二行動ゲームについてのメモ

1,2 a b a $p_{11}$ , $q_{11}$ $p_{12}$ ,$q_{12}$ b $p_{21}$ , $q_{21}$ $p_{22}$ , $q_{22}$ $ p_{ij}+q_{ij}=K $ は 定和ゲーム(constant-sum game) $p_{ij}+q_{ij}=0$ は ゼロ和ゲーム(zero-sum game) $p_{ij}+q_{ij}=K$が成り立たないものは 非ゼロ和…