ゲーム理論:「~かつパレート最適解となる解は存在するか?」系記事に関する但し書き

今回はゲーム理論に関する記事です。

ただ、内容を整理しきれていないため、厳密に記号などを使わない形で書かせてください。そのうち整理して清書したものを、なんらかの媒体で出せればなと思っています。


これらの記事でご紹介した戦略の特徴づけでは、それらがナッシュ均衡解(もしくは部分ゲーム完全均衡点)であることを示すには十分なのですが、戦略の定義としては不足している箇所がございまして、

ある時点  tで、 p(s) t 回目の戦略と異なる戦略を選択したプレイヤーが複数、例えば2人いて、プレイヤー  i とプレイヤー  j がいた場合に、 t+1 回目以降のゲームにおいて、プレイヤー  i に対するミニマックス点を選択すればよいのか、プレイヤー  j に対するミニマックス点を選択すればよいのかが定義されていません。*1 *2


これをなんとか頑張って定義しようとするならば、プレイヤー  i とプレイヤー  j、ないしはプレイヤーの集団  A に対するミニマックス点のようなものとして、

  •  \displaystyle {\min_{s−s_A}(\max_{s_A}(u_A))} を与える戦略の組  s∈S

みたいなものを考えればよいような気もします。 u_A の返り値が、集団  A の利得のベクトル量的なものなので、 min, max は本来の大小関係でなく、パレート支配する/される、で定義すれば、まあそれなりなものが定義できそうな感じがします。


ちなみに意外なことに、これの導入により過去の記事の結論が変わることはありませんし、新しいナッシュ均衡解がでてくることもありません。

というのも、集団  A が逸脱することが分かった場合、集団  A^{c} は実はミニマックス点のようなものを選択し続けるよりも、別のパレート最適解を選択するインセンティブを持ちます。

ただし、厳密には  A の逸脱による  A^{c} の利得や、有限回繰り返し戦略型ゲームにおける最終回のゲームなど、境界値的なことを評価する必要があるのと、別のパレート最適解を選択し続けるような戦略が、過去の記事で述べたようにどのプレイヤーも逸脱するインセンティブが持たないことも必要ではあります。

なお、この「別のパレート最適解」は、 A にとっての、ではなく、全部プレイヤーにとってのパレート最適解のことを指します。

すると結局パレート最適解が選択され続けるので、それは過去の記事でご紹介した戦略の中に含まれているということになります。


以上、過去の記事の補足的なお話でした。ぜひ実生活にお役立てください。

*1:有限回繰り返し戦略型ゲームにおける部分ゲーム完全均衡点の場合は、こちらのミニマックス点を最悪ナッシュ均衡解に読み替えてください。

*2:無限回繰り返し戦略型ゲームにおける部分ゲーム完全均衡点の場合は、「 t+1 回目以降」を「 t+1 回目から  t+ T_{AorB,t,i} 回目まで」に読み替えてください