П.2. Стабильные информационные равновесия
В случае информационного равновесия ситуация, вообще говоря, может быть иной. Действительно, в результате однократного разыгрывания игры может оказаться, что какие-то из игроков (или даже все) наблюдают не тот результат, на который они рассчитывали. Это может быть связано как с неверным представлением о состоянии природы, так и с неадекватной информированностью о представлениях оппонентов. В любом случае, самоподдерживающийся характер равновесия нарушается - если игра повторяется во второй раз, действия игроков могут измениться.
Однако в некоторых случаях самоподдерживающийся характер равновесия может иметь место и при различных (и, вообще говоря, неверных) представлениях агентов. Говоря неформально, это происходит тогда, когда каждый агент (как реальный, так и фантомный) наблюдает тот результат игры, которого ожидает. Для формального изложения нам понадобится дополнить описание рефлексивной игры.
Напомним, что рефлексивная игра задается кортежем {N, (X) е N, fi( )i е N, W, I}. Дополним эту конструкцию набором функций wi(-): W х X' ® W,, i e N, каждая из которых отображает вектор (в, x) в элемент wi некоторого множества W,. Этот элемент Wi и есть то, что i-ый агент наблюдает в результате разыгрывания игры.
Функцию w() будем называть функцией наблюдения i-го агента [77]. Будем считать, что функции наблюдения являются общим
знанием среди агентов, а также примем, что свое собственное действие агент всегда наблюдает.
Если w,(0, x) = (0, x), т.
е. W, = W x X', то i-ый агент наблюдает как состояние природы, так и действия всех агентов. Если, напро-тив, множество W состоит из одного элемента, то i-ый агент ничего не наблюдает.Пусть в рефлексивной игре существует информационное равновесие Xt , т е S+ (напомним, что т - произвольная непустая конечная последовательность индексов из N). Зафиксируем i е N и рассмотрим i-го агента. Он ожидает в результате игры пронаблюдать величину
w, (0,, xi1, .¦¦ , xi i-1, xi, xi i+1, . — , xin).
На самом же деле он наблюдает величину
Wi (0, X1, ... , Xi-1, Xi, Xi+1, Xn).
Поэтому требование стабильности для i-агента означает совпадение величин (1) и (2) (напомним, что эти величины являются элементами некоторого множества W-).
Пусть величины (1) и (2) равны, т.е. i-агент и после разыгрывания игры не сомневается в истинности своих представлений. Однако является ли это достаточным основанием для того, чтобы он и в следующий раз выбрал то же действие x,? Ясно, что ответ отрицательный, что продемонстрируем на следующем примере.
Пример П.1. [77]. Пусть в рефлексивной биматричной игре, где W = {1, 2}, выигрыши заданы биматрицами (агент 1 выбирает строку, агент 2 - столбец, то есть X1 = X2 = {1; 2}), приведенными на Рис. 31,
0 = 1 0 = 2 ' (1,1) (0,0) ^ Г (0,1) (1,2) ^
v (0,1) (2,0) J [ (1,1) (2,2) 0
Рис. 32. Граф рефлексивной игры в примере П.1
Рис.
31. Матрицы выигрышей в примере П.1 а граф рефлексивной игры имеет вид, изображенный на Рис. 32.Пусть при этом в = в1 =1, в2 = в21 = 2, и каждый агент наблюдает свой выигрыш (т.е. функция наблюдения агента совпадает с его функцией выигрыша). Ясно, что информационным равновесием является набор x1 = x2 = x21 = 2, т. е. первый и второй агенты, а также 21-агент выбирают вторые действия. Однако реальное состояние природы в = 1 становится известным второму агенту после розыгрыша игры (и получения им выигрыша 0 вместо ожидаемого 2). Поэтому в следующий раз второй агент выберет действие x2 = 1, что в случае повторяющейся игры побуждает и первого агента изменить свое действие (выбрать x1 = 1). •
Таким образом, для стабильности равновесия необходимо чтобы и /j-агент, i, j e N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать
wj (вij, xij1, .¦¦ , xijj-1, xij, xijj+1, xijn).
На самом же деле (т. е. i-субъективно, ведь /j-агент существует в сознании /-агента) он наблюдает величину
w (e x/u . , x i j-1, Xij, xi j+1, * * ^ xin).
Поэтому требование стабильности для /j-агента означает совпадение величин (3) и (4).
В общем случае, т.е. для и-агента, ti eS+, условие стабильности определим следующим образом.
Информационное равновесие x^ , ti eS+, будем называть стабильным при заданной структуре информированности I, если для любого ti eS+ выполняется
wi (вti, xti1, .¦¦ , xti xti, xti i+1, xtin)
wi (ви xт1, .¦¦ , xтi-1, xti, xti+Ь xtn).
Информационное равновесие, не являющееся стабильным, будем называть нестабильным. В частности, информационное равновесие в примере П.1 является нестабильным. Следующее утверждение дает оценку сложности проверки стабильности информационного равновесия.
Утверждение П.1. [77]. Пусть структура информированности I имеет сложность v, и существует информационное равновесие x ti eS+. Тогда система соотношений (5) содержит не более чем v попарно различных условий.