<<
>>

§ 4. ПРИМЕР: ПРОБЛЕМА РЕАКЦИИ НА СТИМУЛЫ

Оказывается, что с помощью математических методов, близких к тем, которые применяются в теории регулирования, можно решать некоторые проблемы, относящиеся к реакции живых организмов (животных и людей) на внешние стимулы.
Проблемы такого рода имеют практическое значение не только для психологии, но и для экономического анализа.

Рассмотрим следующий пример

Пусть рп+1 обозначает вероятность того, что животное отреагирует на данный комплекс стимулов после п+1 его повторений желаемым для экспериментатора образом; назовем ее кратко вероятностью реакции. Статистические исследования поведения животных показывают, что вероятность рп+\ зависит от предшествующих реакций животного на данный комплекс стимулов. Вероятность рп+\ тем выше, чем выше вероятность реакции после /г-го повторения стимулирования, причем в приближении эту зависимость можно принять линейной. Отсюда можно записать разностное уравнение:

Pnv\=a> + mp„ (4.12)

из которого видно, что рп+1 есть линейная функция Рп. Очевидно, ЧТО 0</?п<1 И ибо эти

переменные обозначают вероятности и О, ибо последовательное повторение стимулирования увеличивает (во всяком случае, не уменьшает) вероятность реакции.

Уравнение (4.12) выражает динамику процесса приобретения животным навыков реакции на определенный комплекс стимулов. Поэтому его нередко определяют как уравнение самообучения. Параметры а и m устанавливаются на основе.экспериментов.

Уравнение (4.12) удобно записать по-иному. Запишем: m = l—а — Ь, где а>О и Ь>0; поскольку т > 0, то 1—а — &>0. Тогда

А+1 = *-К1— а~Ь)Рп = Рп + а(1— Рп) — Ьрп (4.13) или

A+i — А = 0 — А) — ьРп• (4.13а)

Уравнение вида (4.1 За) показывает, от чего зависит улучшение реакции животного на стимулирование, то есть прогресс в процессе «самообучения». Это улучшение выражает разность Дрп+і=рп+1—рп в левой части уравнения (4.13а).

Рассмотрим ближе, что означают выражения 1—рп и — рп =0 — рп в правой части уравнения (4.12).

Первое из них определяет максимально возможную степень улучшения, а второе — максимально возможную степень ухудшения результатов эксперимента, ибо наилучший из достижимых результатов есть Pn+i=l, а наихудший есть рп+1 = 0. Поэтому крп+і=рп+і — рПу то есть фактически достигнутое улучшение результатов экспериментов, как это следует из уравнения (4.13а), равно взвешенной сумме максимально возможной степени улучшения и максимально возможной степени ухудшения результатов эксперимента. Весами слагаемых в этой сумме являются параметры а и 6, причем параметр а зависит от совокупности обстоятельств, которые содействуют максимальному улучшению результатов эксперимента, а параметр Ь зависит от обстоятельств, которые вызывают максимальное ухудшение результатов эксперимента. Следовательно, параметр а можно считать мерой интенсивности действия положительных стимулов, а параметр b — мерой интенсивности действия отрицательных стимулов или так называемых антистимулов. Например, положительными стимулами могут быть награды, а отрицательными — наказания или другие неприятности, связанные с реакцией животного.

Решим уравнение (4.13) способом, который уже несколько раз применялся в настоящей работе. Определим прежде всего, существует ли состояние равновесия и какому значению р соответствует это состояние. Для этого заменим разностное уравнение (4.13) обычным уравнением, предположив, что переменные Рп+\= Рп== Р> то есть что вероятность реакции установилась на неизменном уровне. Тогда получим уравнение:

р = а + ( 1 —а — Ь)р,

откуда

р= (при условии, что а + ЬФ 0).

Зная значение переменной, соответствующей состоянию равновесия /?, исчислим далее величину отклонений от этого значения:

Pn = Pn-P = Pn--^J'

Отсюда

Рп = Рп + ТТТ

и, аналогично,

— а

Рп+\—Рп+\-Т а + ь •

Подставляя эти значения в уравнение (4.13), получим приведенное разностное уравнение:

A+i + rfr-e + d-i-^A + O-e -Ь)^,

которое после приведения принимает следующий вид:

ря¥1 = {\-а-Ь)ря.

(4.14)

Решение этого уравнения можно найти без труда рекуррентным способом:

Ан-1 = О-а-бГ>0> (4.15)

где ро есть исходная вероятность, то есть вероятность, с которой животное реагирует на данный комплекс стимулов перед началом эксперимента.

Учитывая, что 1—а — &Х), из формулы (4.15) следует, что условие устойчивости процесса обучения животного реакции на определенный комплекс стимулов состоит в том, чтобы выполнялось двойное неравенство 0<1—"а —6<1, откуда 0<а+6<1. Если это

условие выполняется, торл+1->0 и рп,) -> а ^ b , то есть к состоянию равновесия, если со,

Если a+b = 1 (то есть 1—а — 6 = 1), то в принципе формулу (4.15) можно также применять, но тогда рп+1 = р09 то есть вероятность реакции в ходе процесса не изменяется и постоянно равна исходной вероятности р0. Животное не делает успехов в «учебе» (обучении).

Рассмотрим полученное решение более подробно.

При условии что 0<а + 6<1, имеем pn+l -» J^b ПРИ

  1. Что означает этот результат? Оказывается, что при многократном повторении эксперимента вероятность реакции животного на определенный комплекс стимулов стремится к некоторому пределу, который равен отношению меры положительных стимулов к сумме мер положительных и отрицательных стимулов (антистимулов).

Рассмотрим несколько частных случаев. .

  1. Если а = 0, а b ФО, то рЛ+і->0; это означает, что если применяются только антистимулы, то животное отучится реагировать, ибо оно всегда будет встречаться с «наказанием».
  2. Если аФ 0, а Ь = 0, то /?Л+-г->1; это означает, что при использовании только положительных стимулов процесс обучения животного достигнет такого состояния, когда животное «наверное» или «почти наверное» прореагирует на определенный стимул.
  3. Если а = Ьф 0, то ; это означает, что

при одинаковой интенсивности стимулов и антистимулов вероятность реакции стремится к 1/2. После достаточного числа опытов животное настолько дезориентируется, что реагирует в половине случаев.

Следует также заметить, что результаты рассматриваемого процесса обучения в общем случае не зависят от абсолютных значений положительных стимулов

и антистимулов, а лишь от соотношения r — -j> то есть от соотношения величин положительных стимулов и меры антистимулов. В самом деле рп+\ -> а

->—-— = -rr-^т—.

Следовательно, соотношение г= 4 Ь

является мерой применяемого метода обучения, его можно назвать структурой мотивации. От абсолютных значений положительных стимулов и антистимулов зависит, однако, число повторений эксперимента, необходимых для достижения желаемой цели. Как видно из формулы (4.15), скорость сходимости тем выше, чем меньше значение 1 — а — Ь, то есть чем выше значение а+Ь. Таким образом, результат процесса самообучения зависит от структуры мотивации, скорость же, с которой этот результат достигается, зависит от совокупной интенсивности мотивации.

Описанная проблема — интересный пример использования математических методов (в данном случае, разностных уравнений) для решения и анализа некоторых проблем психологии. Можно, например, поставить следующий вопрос: с какой интенсивностью нужно применить положительные стимулы и антистимулы, чтобы с определенной вероятностью достигнуть желательной реакции животного, то есть чтобы где z — заданная величина. Сформули

рованный таким образом вопрос является типичной задачей теории регулирования.

Решение этой задачи весьма несложно. В самом деле, предполагая, что /?п+і->2, получаем уравнение

Ґ z

•у-рр- =г, откуда г — • Если отношение положи-

г

тельных стимулов к антистимулам равняется »

то Рп+\—при оо. Если, например, принять, что

95

95 100 1П чтог = -щ-, то г = — = 19, это означает, что ^- = 19. Положительные стимулы должны быть в

19 раз сильнее, чем антистимулы.

Описанный пример регулирования может быть приложен к решению соответствующих экономических проблем, если исходить из предпосылки, что реакции людей на положительные стимулы и антистимулы возникают по такой же или подобной схеме. Положительными стимулами в работе отдельных людей или коллективов являются всякого рода награды, премии, прибыли и т. п., антистимулами же являются наказания, убытки, понесенные вследствие неудач при реализации тех или иных мероприятий, и по другим причинам и т.

д.

Какие практические выводы вытекают из анализа возможностей использования эффективной системы положительных стимулов и антистимулов в хозяйственной деятельности?

Если вероятность достижения установленной цели должна превысить V2, то интенсивность положительных стимулов (например, ожидаемой прибыли) должна превышать интенсивность антистимулов (возможность убытков). Отсюда вытекает четкий принцип, который должен соблюдаться в системах стимулирования, в частности премирования. Если работа человека или коллектива (например, предприятия) связана с возможностью возникновения убытков -(антисти- мулов), то следует применять положительные стимулы (премии, дополнительные прибыли и т. п.) с большей интенсивностью, чем интенсивность существующих антистимулов,

В связи с этим возникает и другой вопрос: стоит ли бороться с антистимулами, коль скоро можно ослабить их воздействие, соответствующим образом увеличив стимулирование? Разумеется, если устранение антистимулов наталкивается на серьезные трудности, то этот метод можно использовать. Однако с экономической точки зрения такое поведение нерационально, ибо оно требует установить высокие премии, значительно превышающие интенсивность антистимулов; Тот же эффект может быть с меньшими затратами достигнут путем уменьшения или устранения антистимулов. Из формулы г = yqppr видно, что если мы

хотим добиться желаемой реакции с высокой степенью достоверности, то есть 2=1, то значение г должно быть весьма большим. Поскольку г = -у, то пришлось бы значительно увеличить значение а, то есть выплачивать огромные премии, отчисления от прибылей и т. п., ибо значение b существенно больше нуля. Но того же результата можно добиться с меньшими затратами на премии и отчисления от прибылей, если S 0, то есть если антистимулы совсем или почти устранены.

Отсюда вытекает практический вывод: действенное и экономичное побуждение к усиленной хозяйственной деятельности прежде всего требует устранения антистимулов, тормозящих эту деятельность.

Разумеется, это не всегда возможно. Следует также отметить, что быстрое достижение цели требует наличия положительных стимулов соответствующей величины. Дело в том, что, как мы уже убедились, скорость, с которой процесс реакции на стимулы сходится к намеченному результату, зависит от абсолютного значения суммы а+Ь. Следоваї'ельно, хотя при постоянном значении а уменьшение величины b и улучшает структуру мотивации г,.но одновременно происходит и уменьшение суммы а + Ь (интенсивности стимулов), определяющей скорость сходимости. Таким образом, для достижения надлежащей скорости необходима соответствующая величина положительных стимулов.

Интересным примером побуждения крестьян к возделыванию некоторых технических культур, особенно подверженных воздействию случайных факторов — вымерзанию, засухе, граду и т. п., посредством устранения антистимулов, — является использование системы страхования посевов от стихийных бедствий. Практика показала, что даже значительное "повышение закупочных цен на такие культуры (следовательно, повышение положительного стимулирования) недоста- дочно способствовало увеличению площадей под эти- ми культурами. В то же время устранение антистимулов посредством страхования, осуществление которого было связано с относительно небольшими затратами, способствовало значительному увеличению площадей под определенными техническими культурами

Думается, что использование подобного метода устранения антистимулов возможно и целесообразно также и в других областях хозяйственной деятельности. Так, например, введение страхования от потерь, которые могут временно возникнуть на данном предприятии, осуществляющем программу модернизации и совершенствования производства, побудило бы многие предприятия к разработке и реализации планов организационно-технического прогресса. Можно предполагать, что такой метод был бы значительно экономичнее и в то же время эффективнее, чем увеличение премий за технический прогресс.

ГЛАВА 5

<< | >>
Источник: О. Ланге. ВВЕДЕНИЕ ЭКОНОМИЧЕСКУЮ КИБЕРНЕТИКУ. Перевод с польского. Издательство "ПРОГРЕСС" Москва. 1968. 1968

Еще по теме § 4. ПРИМЕР: ПРОБЛЕМА РЕАКЦИИ НА СТИМУЛЫ: