<<
>>

П.4. Случай наблюдаемых действий агентов

В разделе П.1 приведено определение информационного равновесия, которое может интерпретироваться как набор субъектив-

ных равновесий - i-ый (реальный) агент, i е N, обладающий структурой информированности I,, определяет набор действий

*

(xia (Iia))a eS, который является равновесием с его субъективной

точки зрения.

В частности, он ожидает от 1-го реального агента,

*

j е N, выбора действия xi}- (I.j) (напомним, что фантомный j-агент

является образом j-го агента в представлениях i-го).

В этом разделе мы рассмотрим случай, когда функцией наблюдения является вектор действий всех агентов (именно этот случай, наверное, наиболее близок к задачам моделирования команд):

Wi (0, Xb..., Xn) = (xb..., Xn). Тогда стабильным является информационное равновесие

* / * \

x = (xai), eN, aeS, удовлетворяющее следующему соотношению:

**

(1) V i е N, V а е S x^ = xt .

Соотношение (1) означает, что действие любого реального агента совпадает с действием, ожидаемым от него любым другим (реальным или фантомным) агентом.

Введем следующее предположение относительно целевых функций f (•) и множеств W, X,:

П.1. V i е N, V а е S, для любых представлений 0а е W и 0'а е W таких, что 0а Ф 0'с, и для любой обстановки игры

xOi-i е Х- = П X

** Xai ,-i

где BRi(0ai, x*. -i) = Arg max f (0

ai 5 Xa1 ,•••, XS ,i-1, yi, Xai, i+1 ,•••, Xain ) .

yl еХ-

Утверждение П.3. Г771. Пусть выполнено предположение П.1 и существует информационное равновесие x . Тогда x является стабильным информационным равновесием в том и только в том случае, если структура информированности игры такова, что (3) V i е N, V а е S 0а = 0.

Следствие. Если выполнено предположение П.1, то стабильные информационные равновесия могут возникать только в рамках структур информированности, удовлетворяющих (3), то есть в

(2) BR0 X*.

-i) n BRi(0'ci, x*. -i) = 0,

рамках структур информированности единичной глубины. При этом, в частности, невозможны ложные равновесия.

Уместно отметить аналогию между условием П.1 и «условием равноправия функций предпочтения» в [10, с. 259].

При ослаблении требования (1) результат утверждения П.3 теряет силу. Например, если считать «стабильным» информационное *

равновесие X , удовлетворяющее свойству

**

(4) V i, j е N Xj, = xt

(действие любого реального агента совпадает с действием, ожидаемым от него любым другим реальным агентом), то в рамках предположения П.1 существуют структуры информированности, не удовлетворяющие (3), при которых соответствующие информационные равновесия «стабильны» в смысле (4).

Утверждение П.3 важно как с точки зрения задач анализа, так и с точки зрения задач синтеза. Действительно, оно позволяет при исследовании свойств информационных равновесий для определенного класса ситуаций (определяемых предположением П.1) выделять при помощью условия (3) множества информационных структур, при которых информационные равновесия могут быть стабильными. С точки зрения задачи информационного управления, утверждение П.3 накладывает ограничения на множество управляющих воздействий, приводящих к стабильному равновесию игры управляемых субъектов.

Пусть теперь каждый из n агентов характеризуется своим типом r, > 0, i е N, и каждый агент знает свой тип, но, вообще говоря, не знает тип остальных агентов. Будем считать, что целевая функция i-го агента имеет вид f(r,, x), т. е. зависит от его собственного типа, но не от типов оппонентов. Относительно типов каждый из агентов имеет иерархию представлений, состоящую из следующих компонент: r.j - представление i-го агента о типе j-го агента, rijk - представление i-го агента о представлениях j-го агента о типе k-го агента и т.д., i, j, k е N.

Содержательное различие между обсуждениями в терминах неопределенного параметра 0 и в терминах вектора типов r = (r1, r2, ..., rn) е состоит в следующем.

В первом случае иногда естественным является предположение о том, что значение 0 наблюдается агентами, которые могут на основании этого кор-

ректировать свои представления. Во втором случае предполагается, что вектор типов r = (rb r2, ..., rn) непосредственно не наблюдаем, поэтому агенты могут корректировать свои представления лишь на основании наблюдаемых действий оппонентов. При этом согласно утверждению П.2 все стабильные равновесия являются истинными. Поэтому сосредоточим внимание на исследовании стабильности. Условие (1) и здесь будет задавать стабильное ин-формационное равновесие, а предположение П.1 и утверждение П.3 перепишем следующим образом.

П.1Г. V i e N, V s e S, для любых представлений rsi и r'si та*

ких, что r* Ф r'c, и для любой обстановки игры xsi -i e X.t

BR,(rah x^_t ) n BR,(r'ah хот. -i) = 0, где BRi(rsi, x*,-i) = Argmax f(r*,xOTl,...,x^,,-I,y,,x*

,i +1,..., xsin ) .

yt eXi

Утверждение П.3Г. Г771. Пусть выполнено предположение П.1г и существует информационное равновесие x . Тогда x является стабильным информационным равновесием в том и только в том случае, если структура информированности игры такова, что V i e N, V s e S r* = rh

Определим следующие множества:

множество Y пар (x, I), таких, что x e X', I e 3 и вектор x является информационным равновесием при структуре информированности I, где 3 - множество всевозможных структур информированности (отметим, что 3 зависит от вектора типов r).

множество YXI) с X' векторов действий агентов, являющихся информационными равновесиями в рамках структуры ин-формированности I;

множество YI(x) с 3 информационных структур, в рамках которых вектор x действий агентов является информационным равновесием (решение обратной задачи).

Определим также подмножества этих множеств, выделяемые требованием стабильности информационного равновесия:

множество Y пар (x, I), таких, что x e X', I e 3 и вектор x является стабильным информационным равновесием при структуре информированности I;

множество Yx(I) сX' векторов действий агентов, являющихся стабильными информационными равновесиями в рамках структуры информированности I;

множество Y/(x) с 3 информационных структур, в рамках которых вектор X действий агентов является стабильным информационным равновесием.

Обозначим: I0 - структуру информированности единичной глубины, которая соответствует тому, что вектор r истинных типов агентов является общим знанием.

Заметим, что Y/(I0) = Yx(I0) - любое информационное равновесие, соответствующее общему знанию, является стабильным.

В терминах введенных множеств истинное равновесие образует любая пара (x, I) е Y s такая, что (x, I0) е Y. Содержательно это означает, что вектор действий X останется (стабильным) информационным равновесием, если вектор типов станет общим знанием.

Ложное равновесие образует любая пара (x, I) е Y* такая, что (x, I0) ё Y. Содержательно это означает, что вектор действий x перестанет быть информационным равновесием, если вектор типов станет общим знанием.

Пусть x = (x*,., x*) - стабильное равновесие. Определим для каждого i е N следующие множества:

Ri = {r- еИ+jx* е BR-(rt,X-.)}.

Эти множества не зависят от структуры информированности. Поэтому они позволяют сформулировать два утверждения, проясняющие связь между структурой информированности и стабильностью равновесия.

Утверждение П.4. [771. Пусть x - стабильное равновесие. Если для любого i е N множество Ri состоит ровно из одного элемента, то вектор типов является общим знанием (и, соответственно, равновесие истинное).

Утверждение П.5. [771. Если равновесие x является стабильным при некоторой структуре информированности, то для элементов этой структуры при любых i е N и а е S выполняется rai е R

Утверждение П.5 накладывает довольно жесткие требования на структуру информированности: если равновесие является стабильным, то все типы реальных агентов, а также представления о типах принадлежат множествам R

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме П.4. Случай наблюдаемых действий агентов: