<<
>>

П.5. Динамика структур информированности

Рассмотрим динамику поведения агентов - повторяющуюся рефлексивную игру (ПРИ) , заключающуюся в многократном повторении рефлексирующими агентами актов выбора своих действий. Динамические эффекты могут возникнуть, если в процессе игры агенты получают новую информацию, свидетельствующую о необходимости коррекции своих представлений - изменения значений компонентов структуры информированности.
Таким образом, в ПРИ на каждом шаге выбор каждого агента состоит из двух этапов - коррекции компонентов структуры информированности и выбора действия, являющегося субъективным информационным равновесием в рамках новой структуры его информированности.

Определим историю игры - совокупность выбранных к рассматриваемому моменту времени действий агентов и реализовавшихся значений их целевых функций. Множество всевозможных историй игры, которые могут сложиться на очередном шаге, обозначим H. Каждый из агентов обладает в общем случае только частью информации об объективной истории игры - ему достоверно известны его собственные действия и значения его целевой функции, а также, быть может, действия и/или значения целевых функций некоторых оппонентов и/или какие-либо другие агрегированные характеристики результатов деятельности всех или части агентов. Назовем эту информацию h, е H, с H субъективной историей игры i-го агента.

На основании своей субъективной истории игры каждый агент оценивает правильность своих представлений, корректирует их тем или иным образом, и на следующем шаге выбирает действия на основании «новых» представлений.

В силу гипотезы рационального поведения активных агентов при выборе действий каждый из них стремится, чтобы его действие было наилучшим ответом на прогнозируемую обстановку в рамках имеющихся представлений о значении состояния природы. Поэтому равновесием повторяющейся рефлексивной игры можно

считать такую совокупность структур информированности игры в целом и векторов действий реальных агентов, что каждое из действий принадлежит соответствующему субъективному равновесию, определенному на основании данной структуры информированности.

Такую совокупность представлений агентов и их действий будем называть согласованной - действия агентов совпадают с прогнозируемыми в рамках сложившейся структуры информированности и наоборот: структура информированности принадлежит множеству решений обратной задачи информационного управления [77].

Формализуем приведенные выше качественные рассуждения о динамике поведения агентов.

Выше были определены три множества: множество Y пар (x, I), таких, что x е X', I е 3 и вектор x является информационным равновесием при структуре информированности I, где 3 - множество всевозможных РКД; множество Yx(I) с X' векторов действий агентов, являющихся информационными равновесиями в рамках структуры информированности I; множество Y/(x) с 3 информационных структур, в рамках которых вектор x действий агентов является информационным равновесием.

В более общем случае, обозначив h(x) с H - множество всевозможных историй игры, которые могут сложиться при векторе действий x е X' на очередном шаге, X(h) - множество векторов действий агентов, приводящих к реализации истории игры h е H, определим:

множество Yh пар (h, I), таких, что h е H, I е 3, $ x е X': h е h(x) и вектор x является информационным равновесием при структуре информированности I;

множество Yh(I) = U h(x) с H историй игры, реализуемых

xеY (I)

векторами действий, являющихся информационными равновесиями при структуре информированности I;

множество Yh(h) с 3 информационных структур, в рамках которых существует вектор x действий агентов, являющийся информационным равновесием и приводящий к реализации данной истории, то есть h е h(x).

Определим модель динамики информационной структуры i-го агента, i е N, как отображение Gi(Ii, Yh(hi)): 3 х 23 ® 3 текущей

информационной структуры i-го агента и множества 23 информационных структур Yh(hi), согласованных с наблюдаемой им на рассматриваемом шаге историей игры hi, во множество информационных структур.

Содержательно модель динамики информационной структуры описывает, как агент изменяет иерархию своих представлений в зависимости от ее текущего значения и множества информационных структур, которые согласованы с субъективной истории игры.

Формально последовательность информационных структур i- го агента и последовательность его действий при заданной начальной информационной структуре Ii0 можно записать в следующем виде:

It е G,(It1, Yh(hf1)), i е N, t = 1, 2, ..., .

xt е Yx( It),

Равновесие ПРИ формально можно определить как множество векторов x с компонентами

X- е Yx(Ii), i е N,

и информационных структур

I- е G-(Ii, Yh(h-(Xi))), i е N.

Как и в любых моделях динамики коллективного поведения [48, 62, 63, 80], при исследовании ПРИ возникают следующие задачи:

получение условий существования равновесия ПРИ и его единственности;

изучение устойчивости и скорости сходимости последовательностей (1) и (2) в зависимости от модели G(-) динамики информационной структуры;

анализ областей притяжения различных равновесий и др. Качественно сложность теоретического анализа свойств ПРИ

обусловлена тем, что в них изменяются информационные структуры, и для одной и той же статической рефлексивной игры существует множество динамических аналогов, порождаемых разнооб-

разными моделями динамики информационных структур.

Кроме того, различные модели динамики информационных структур порождают различные определения равновесия ПРИ (см. выраже-ние (3)) - одна и та же пара (x, I) может быть равновесием ПРИ с одной моделью динамики информационных структур и не быть равновесием ПРИ с другой такой моделью.

Общие результаты исследования ПРИ на сегодняшний день отсутствуют, поэтому в [77, 105] и выше приведен анализ простейших частных случаев.

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме П.5. Динамика структур информированности: