ゲーム理論:記憶力に限界があるプレイヤーたちによる有限回繰り返し戦略型ゲーム

ゲーム理論です。走り書きです。

繰り返し戦略型ゲームの定義において、 n 回目の戦略を選択するに際し、 n-1 回目までの全プレイヤーの戦略の選択履歴を引数にしましたが、これを直前1回だけにするとか、直前数回にするとかといったバリエーションが存在します。

で、もろもろすっ飛ばしますが、直前1回だと、有限回繰り返しゲームでも常に個々のゲームで見ればパレート最適解が選択されるようなナッシュ均衡解が存在します(存在する場合があります)。最終回のナッシュ均衡解オチが発生しません。

というのも、いつが最終回かわからないからですね。決して記憶領域が狭いからではないです。

記憶領域が狭くても最終回がいつか分かってっている場合は、最終回はナッシュ均衡解になります。むしろ制裁の条件が直前の結果でしか判定できないから成り立つ解の候補は減るんじゃないかな。