П.5. Динамика структур информированности
Определим историю игры - совокупность выбранных к рассматриваемому моменту времени действий агентов и реализовавшихся значений их целевых функций. Множество всевозможных историй игры, которые могут сложиться на очередном шаге, обозначим H. Каждый из агентов обладает в общем случае только частью информации об объективной истории игры - ему достоверно известны его собственные действия и значения его целевой функции, а также, быть может, действия и/или значения целевых функций некоторых оппонентов и/или какие-либо другие агрегированные характеристики результатов деятельности всех или части агентов. Назовем эту информацию h, е H, с H субъективной историей игры i-го агента.
На основании своей субъективной истории игры каждый агент оценивает правильность своих представлений, корректирует их тем или иным образом, и на следующем шаге выбирает действия на основании «новых» представлений.
В силу гипотезы рационального поведения активных агентов при выборе действий каждый из них стремится, чтобы его действие было наилучшим ответом на прогнозируемую обстановку в рамках имеющихся представлений о значении состояния природы. Поэтому равновесием повторяющейся рефлексивной игры можно
считать такую совокупность структур информированности игры в целом и векторов действий реальных агентов, что каждое из действий принадлежит соответствующему субъективному равновесию, определенному на основании данной структуры информированности.
Такую совокупность представлений агентов и их действий будем называть согласованной - действия агентов совпадают с прогнозируемыми в рамках сложившейся структуры информированности и наоборот: структура информированности принадлежит множеству решений обратной задачи информационного управления [77].Формализуем приведенные выше качественные рассуждения о динамике поведения агентов.
Выше были определены три множества: множество Y пар (x, I), таких, что x е X', I е 3 и вектор x является информационным равновесием при структуре информированности I, где 3 - множество всевозможных РКД; множество Yx(I) с X' векторов действий агентов, являющихся информационными равновесиями в рамках структуры информированности I; множество Y/(x) с 3 информационных структур, в рамках которых вектор x действий агентов является информационным равновесием.
В более общем случае, обозначив h(x) с H - множество всевозможных историй игры, которые могут сложиться при векторе действий x е X' на очередном шаге, X(h) - множество векторов действий агентов, приводящих к реализации истории игры h е H, определим:
множество Yh пар (h, I), таких, что h е H, I е 3, $ x е X': h е h(x) и вектор x является информационным равновесием при структуре информированности I;
множество Yh(I) = U h(x) с H историй игры, реализуемых
xеY (I)
векторами действий, являющихся информационными равновесиями при структуре информированности I;
множество Yh(h) с 3 информационных структур, в рамках которых существует вектор x действий агентов, являющийся информационным равновесием и приводящий к реализации данной истории, то есть h е h(x).
Определим модель динамики информационной структуры i-го агента, i е N, как отображение Gi(Ii, Yh(hi)): 3 х 23 ® 3 текущей
информационной структуры i-го агента и множества 23 информационных структур Yh(hi), согласованных с наблюдаемой им на рассматриваемом шаге историей игры hi, во множество информационных структур.
Содержательно модель динамики информационной структуры описывает, как агент изменяет иерархию своих представлений в зависимости от ее текущего значения и множества информационных структур, которые согласованы с субъективной истории игры.
Формально последовательность информационных структур i- го агента и последовательность его действий при заданной начальной информационной структуре Ii0 можно записать в следующем виде:
It е G,(It1, Yh(hf1)), i е N, t = 1, 2, ..., .
xt е Yx( It),
Равновесие ПРИ формально можно определить как множество векторов x с компонентами
X- е Yx(Ii), i е N,
и информационных структур
I- е G-(Ii, Yh(h-(Xi))), i е N.
Как и в любых моделях динамики коллективного поведения [48, 62, 63, 80], при исследовании ПРИ возникают следующие задачи:
получение условий существования равновесия ПРИ и его единственности;
изучение устойчивости и скорости сходимости последовательностей (1) и (2) в зависимости от модели G(-) динамики информационной структуры;
анализ областей притяжения различных равновесий и др. Качественно сложность теоретического анализа свойств ПРИ
обусловлена тем, что в них изменяются информационные структуры, и для одной и той же статической рефлексивной игры существует множество динамических аналогов, порождаемых разнооб-
разными моделями динамики информационных структур.
Кроме того, различные модели динамики информационных структур порождают различные определения равновесия ПРИ (см. выраже-ние (3)) - одна и та же пара (x, I) может быть равновесием ПРИ с одной моделью динамики информационных структур и не быть равновесием ПРИ с другой такой моделью.Общие результаты исследования ПРИ на сегодняшний день отсутствуют, поэтому в [77, 105] и выше приведен анализ простейших частных случаев.