2.2. МОДЕЛЬ МАРШАКА-РАДНЕРА
Рассмотрим команду (в терминологии Маршака-Раднера) - множество агентов N = {1, 2, ..., n}, в которой i-ый агент принимает решение (выбирает действие) xi е Xi, i е N. Выигрыш команды u(x, в) зависит от вектора решений членов команды x = (xb x2, ..., xn) е X' = ^Xi и от состояния природы в е W.
isN
Отметим, что в данной модели (как и в большинстве теоретико-игровых моделей, следующих традициям Маршака-Раднера) целевые функции всех агентов - членов команды - одинаковы (более того, в некоторых работах команда определяется именно как множество агентов, имеющих совпадающие целевые функции - см., например, [171]). Данное предположение отражает такое свойство команды, как единство цели деятельности ее членов. Но, агенты в общем случае характеризуются различающимися множествами допустимых действий и имеют различную априорную информацию о состоянии природы (совокупность этих представлений составляет информационную структуру команды [113, 172]).
Агент i принимает решения в соответствии со своей функцией принятия решений - отображением di: W ® Xi-, принадлежащим множеству допустимых отображений Di, i е N. Вектор d = (di(-), d2(-), ... , dn(-)) называется функцией принятия решений команды.
Фиксируем вероятностное распределение p(-) на множестве W. Ожидаемый выигрыш команды равен
(1) U(d(), p()) = j u(d(0), 0) p(9)de.
W
Если априори известно вероятностное распределение на множестве распределений p(-), то можно вычислить Байесовский выигрыш команды как математическое ожидание выражении (1).
Функция принятия решений d(-), максимизирующая Байесовский выигрыш команды, называется Байесовской функцией принятия решений - см. [163]. Достаточные условия оптимальности и условия единственности оптимальной функции принятия решений для квадратичных функций u(-) приведены в [153, 163].Таким образом, первая задача - нахождение при заданной информационной структуре функции принятия решений, которая максимизировала бы ожидаемый выигрыш команды. Вторая задача - выбор информационной структуры, которая (при использовании соответствующей оптимальной функции принятия решений) также максимизировала бы ожидаемый выигрыш команды.
Модель Маршака-Раднера развивалась во многих работах (см. библиографию в [112]). Классическими стали работы: Т. Гровса [133, 134] по распределению ресурса и стимулированию в командах (когда целевые функции агентов начинают различаться за счет введения стимулирования, побуждающего агентов принимать согласованные решения); Эрроу и Раднера [110] по изучению влияния информированности членов команды (информационной структуры) на эффективность использования ресурса (см. также обзор в монографии [144]).
Таким образом, модель Маршака-Раднера учитывает непротиворечивость целей членов команды, осуществляющих совместную деятельность, но почти не акцентирует внимание на других характеристиках команд (см. Табл. 1).