<<
>>

Общая постановка задачи и модель процесса научения.

Качественно в общем виде задача может быть сформулирована следующим образом. Каждый агент характеризуется некоторым первоначальным уровнем навыка (например, производительностью труда).
В процессе осуществления деятельности производительность труда агента растет по мере приобретения опыта, совершенствования навыков и т.д. (имеет место обучение в процессе работы), причем скорость этого роста (так называемая скорость научения - см. формальное определение ниже) у каждого агента индивидуальна. Спрашивается, как оптимальным образом распределить во времени работу между агентами. Ведь один агент, уро-

вень начальной квалификации которого низок, будучи с самого начала сильно загружен, быстро повысит свою квалификацию и сможет потом работать эффективно. С другой стороны, быть может, рациональным является загрузить сразу тех агентов, которые имеют более высокую начальную квалификацию? Ответы на эти вопросы не очевидны, тем более что необходимо доопределить, что понимается под «оптимальным» распределением работы между агентами. В качестве критерия эффективности могут выступать суммарные затраты агентов, время выполнения командой заданного объема работ, результат, достигнутый за фиксированное время, и т.д.

Перейдем к формализации рассмотренной ситуации - начав с наиболее простой модели, будем потом постепенно ее усложнять. При этом ограничимся случаем итеративного научения [63], соответствующего достаточно рутинным видам деятельности и представляющего собой многократное повторение обучаемой системой действий, проб, попыток и т.д. для достижения фиксированной цели при постоянных внешних условиях. Итеративное научение (ИН) лежит в основе формирования навыков у человека, условных рефлексов у животных, обучения многих технических (материализованных) и кибернетических (абстрактно-логических) систем и является предметом исследования педагогической и инженерной психологии, психофизиологии, педагогики, теории управления и других наук (см.

обзор в [63]).

Постоянство как внешних условий, так и цели, позволяет проводить количественное описание ИН в виде кривых научения - зависимостей критерия уровня научения от времени или от числа повторений (итераций).

Многочисленные экспериментальные данные (см. [61, 63]) свидетельствуют, что важнейшей общей закономерностью итеративного научения является замедленно-асимптотический характер кривых научения: они монотонны, скорость изменения критерия уровня научения со временем уменьшается, а сама кривая асимптотически стремится к некоторому пределу. В большинстве случаев кривые итеративного научения аппроксимируются экспоненциальными кривыми.

Различают два аспекта научения. Первый аспект - результативный - при научении система должна достичь требуемого результата - качества выполнения действий с приемлемыми затрата-

ми времени, энергии и т.д. Второй аспект - процессуальный: адаптация, приспособление научаемой системы к некоторому виду действий в процессе деятельности (например, упражнения) и т.д. Соответственно, выделяют результативные характеристики итеративного научения и характеристики адаптации [61], которые относятся, как правило, к физиологическим компонентам деятельности - утомляемость и т.п. В настоящей работе речь идет именно о результативных характеристиках научения (характеристики адаптации зачастую имеют совсем другую динамику - см. также предыдущий раздел).

Как отмечалось выше, итеративное научение, как правило, характеризуется замедленно-асимптотическими кривыми научения, аппроксимируемыми экспоненциальными кривыми (см. Рис. 20):

r(t) = r? + (r0 - r?) e -y - t > 0,

43

или дискретной последовательностью

rk = r? + (r0 - r?) e - y k, k = 1, 2, ... ,

где t - время научения, k - число итераций (проб, попыток) с момента начала научения, r(t) (rk) - тип агента (уровень навыка, квалификация) в момент времени t (на k-ой итерации), r0 > 0 -

начальное значение (соответствующее моменту начала научения -

\ ? ? ^ 0 первому периоду времени) типа, r - «конечное» значение, r > r ,

g - некоторая неотрицательная константа, определяющая скорость изменения типа и называемая скоростью научения [63].

43 Условимся в настоящем разделе верхним индексом обозначать номер периода времени, а нижним индексом - номер агента. В случае, когда рассматривается единственный агент, нижний индекс будем опускать. 136

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме Общая постановка задачи и модель процесса научения.: