<<
>>

П.1. Рефлексивные игры и информационные равновесия

Рассмотрим множество N = {1, 2, ..., n} агентов (игроков), информированность которых описывается информационной структурой I = (Ib I2, ..., In), где Iг = (0„ вг], вг]к, ...), i, j, k е N, - структура информированности i-го агента, i е N, di е W - его представления о состоянии природы, dj е W - его представления о представлениях j-го агента, (j е W - представления i-го агента о том, что j-ый агент думает о представлениях k-го агента и т.д.
в общем случае до бесконечности [78].

Если задана структура информированности I, то тем самым задана и структура информированности каждого из агентов (как реальных, так и фантомных - то есть существующих в сознании других реальных и фантомных агентов). Выбор т-агентом, где т - некоторая последовательность индексов из множества N, своего действия хт в рамках гипотезы рационального поведения [78] определяется его структурой информированности IT , поэтому, имея эту структуру, можно смоделировать его рассуждения и определить его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определении исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.

Обозначим S+ - множество всевозможных конечных последовательностей индексов из N, S - объединение S+ с пустой последовательностью, |с| - количество индексов в последовательности s (для пустой последовательности |0| принимается равным нулю).

Если «обычная» игра в нормальной форме определяется как кортеж Г = {N, (X) е N , (fi(-))i е N}, то рефлексивной игрой ГI называ-

ется игра, задаваемая кортежем FI = {N, (Xi)i eN, (fi(-))i eN, I, W}, где N - множество игроков (агентов), Xi - множество допустимых действий i-го игрока, f(-): W х X' ® ^ 1 - его целевая функция, X' = П Xi , i e N, I - структура информированности. Другими

ieN

словами, отличие рефлексивной игры от игры в нормальной форме заключается в том, что в первой информированность игроков не является общим знанием , а описывается некоторой информационной структурой.

Равновесием Нэша игры F в условиях общего знания называется такой вектор x e X действий игроков, одностороннее отклонение от которого не выгодно ни для одного из игроков, то есть:

" i e N, " yi e X, f(x) >f(y„ x-),

где x-i = (x1, x2, ..., xi-1, xi+1, ..., xn) - обстановка игры для i-го игрока,

x, e Xi = П Xj , i e N.

j &

Определим равновесие рефлексивной игры.

Набор действий eS+, называется информационным равновесием [78], если выполнены следующие условия:

структура информированности I имеет конечную сложность v, то есть, дерево I содержит конечный набор попарно различных поддеревьев;

"Я, m e S+ Vi е N Iu = i^ ^ xh" = x^;

" i e N, Vо e S

xO e Arg max f (qoi, W-, O-i, Уi, O+iv, xOin)•

У1 eXi

Будем рассматривать регулярные структуры информированности [78], для задания которых введем вспомогательное понятие регулярного конечного дерева (РКД), которое определим рекур- рентно. Пусть в игре участвуют n агентов. Если (в простейшем случае) все агенты одинаково информированы, то структура информированности имеет сложность n и единичную глубину. Будем представлять эту ситуацию в виде дерева, состоящего из корневой вершины, n ребер и n висячих вершин. Далее РКД может «расти»

следующим образом: к каждой висячей вершине ti, т е S, присое-диняется ровно (n - 1) ребро, при этом возникает (n - 1) висячая вершина tij, j = 1, ..., i - 1, i + 1, ..., n. Построенное РКД будем интерпретировать так: если имеется висячая вершина ti, т е S, то т-агент одинаково информирован с т-агентом (если Т - пустая последовательность, то ii-агент является реальным, и его субъективные представления совпадают с объективными).

Напомним, что, во-первых, максимальная глубина kt РКД i-го реального агента в [78] названа рангом его рефлексии. Во-вторых, любая конечная регулярная информационная структура однозначно (с учетом аксиомы автоинформированности - V i е N V Т, s е S 0tiis = eis [78]) задается перечислением своих висячих вершин.

Обозначим множество параметрических (параметр - вектор в = (0i, 02, ..., 0n) е Wn) равновесий Нэша

Ед<в) = {{Xi}i е N е X' | V i е N, V у, е X-

f(0, X1, Xn) ^fi(0, хЬ Xi-1, Уъ Xi+1, xn)}.

Предположим, что на нижнем уровне {0Tij}j е N конечной регулярной структуры информированности имеет место субъективное общее знание [78] фантомных агентов. Тогда с точки зрения ti- агента возможными являются равновесия их игры из множества EN((0Tij)j е N).

Определим множество наилучших ответов i-го агента на выбор оппонентами действий из множества B с X-i при множестве W возможных состояний природы:

BR(W, B) = U Ar§ m ах f (0, X, X_,. ), i е N,

x_, еB,0еW Xi еХ'

а также следующие величины и множества

En = U En (в),

веО n

X0 = Proj En, i е N,

Х-. = ПXk , i е N, k = 0, 1, 2, ..,

j *i

где

Xk = BRi(W, X--1), k = 1, 2, ... , i е N.

Отображение BRi(-, •): W x X.,- ® X,- называется рефлексивным отображением i-го агента, i е N [78]. В [78] доказано, что

Xk с Xk+1, k = 0, 1, ... , i е N, то есть с ростом ранга рефлексии множества (8) возможных наилучших ответов агентов не сужаются.

Если структура информированности имеет конечную сложность, то можно построить граф рефлексивной игры, наглядно показывающий взаимосвязь между действиями агентов (как реальных, так и фантомных), участвующих в равновесии [78].

Вершинами этого ориентированного графа являются действия Xt, т eS+, отвечающие попарно нетождественным структурам информированности It, или компоненты структуры информированности 0т, или просто номер т реального или фантомного агента, т eS+.

Между вершинами проведены дуги по следующему правилу: к каждой вершине Xsi проведены дуги от (n - 1) вершин, отвечающих структурам Isj, j е N\ {i}. Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.

Подчеркнем, что граф рефлексивной игры соответствует системе уравнений (1) (то есть определению информационного равновесия), в то время как решения ее может и не существовать.

Итак, граф GI рефлексивной игры Ги структура информированности которой имеет конечную сложность, определяется следующим образом:

вершины графа GI соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетождественным структурам информированности;

дуги графа GI отражают взаимную информированность аген-тов: если от одного агента (реального или фантомного) существует путь к другому агенту, то второй адекватно информирован о первом [78].

Если в вершинах графа GI изображать представления соответствующего агента о состоянии природы, то рефлексивная игра Г1 с конечной структурой информированности I может быть задана кортежем ГI = {N, (X), е N, f (•), е N, W, GI}, где N - множество реальных агентов, X, - множество допустимых действий i-го агента, f (•): W хX' ® Ш - его целевая функция, i е N, GI - граф рефлексивной игры.

Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа GI, а не дерева информационной структуры - см. многочисленные примеры в [78] и Рис. 32, Рис. 33, Рис. 34 ниже.

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме П.1. Рефлексивные игры и информационные равновесия: