§ 4. РЕГУЛИРОВАНИЕ И УПРАВЛЕНИЕ. ТИПЫ УПРАВЛЕНИЯ
Заданное значение или норма состояния выхода системы регулирования может- быть постоянной или переменной величиной. В первом случае, когда г — постоянная, говорят о прямом регулировании. Во втором случае говорят о регулировании, совмещенном с управлением. Под управлением мы понимаем определение каждого значения переменной г, то есть переменной нормы системы регулирования. В этом случае регулирование заключается в корректировке отклонений состояния выхода системы от каждого значения переменной нормы этого состояния. Следовательно, регулирование есть выравнивание отклонений от нормы, каждое значение которой определяется управлением.
Могут применяться различные способы определения переменной нормы z. Если z есть некая функция времени t, то есть z=f(t), то говорят о программном управлении, а функцию z=f{t) называют программой управления. Пример программного управления — движение судна по трассе, задаваемой географическими координатами пунктов на этой трассе. Зная скорость судна, можно определить его заданное положение на любой момент. Определенная таким образом трасса является программой управления, а штурвал или авто- матический регулятор устанавливает возможные отклонения от заданной трассы и выравнивает их, стремясь сохранить намеченный курс, то есть программу управления.
Нетрудно привести пример программного управления из области экономики. Пусть P(t) есть программа выпуска чистой продукции на период, равный, скажем, 10 годам. Требуется найти такую функцию капиталовложений A(t), чтобы при данном коэффициенте потребления с эта программа могла быть выполнена.
Тогда по формуле (1.4) между функцией продукции P(t) и капиталовложениями должна существовать зависимость:откуда '
A(t) = (\-c)P(t).
Другим примером программного управления являются станки-автоматы, которые чаще всего управляются в соответствии с некоторой функцией времени
Однако норма z не обязательно является функцией времени. Она может зависеть и от иной величины, которую мы обозначим через w. Тогда мы имеем дело со следящим управлением (или слежением. — Ред.),ибо действие данной системы, определяемое величиной z, основывается как бы на слежении за некоторой другой величиной. Величина w называется ведущей, а норма z называется следящей величиной. Следящая величина есть некоторая функция ведущей величины, за которой она «следит»: z=f(w).
Примером следящего управления может быть прокладка курса корабля таким образом, чтобы расстояние от судна до берега постоянно составляло 10 км. Следовательно, маршрут корабля будет проходит^ «параллельно» береговой линии, то есть на одинаковом удалении от нее. При наличии карты можно рассчитать курс корабля и применить программное.упра- вление. Если же капитан не располагает картой, а береговая линия видна, то он может применять следящее управление, которое в данном случае состоит в постоянном измерении расстояний судна от берега. Здесь задача регулирования — выравнивание отклонений, то есть корректировка курса корабля, если расстояние между ним и берегом будет больше или меньше 10 км. В данной ситуации береговая линия — ведуйдая величина, а курс корабля — следящая величина.
IV
Рис. 11.
Рассмотрим другой пример следящего управления. По двум параллельным трубам А и В протекает жидкость. Скорость потока жидкости в трубе В есть ведущая величина w.- Задача состоит в том, чтобы скорость потока в трубе Л (следящая величина) была равна скорости потока в трубе В (ведущей величине). Техническое решение этой задачи методом следящего управления потребовало бы помещения в трубе В датчика С, то есть устройства, которое измеряло бы скорость -потока жидкости в трубе В, и оснащения трубы А автоматическим регулятором R, увеличивающим \ или уменьшающим скорость потока жидкости в этой тру- Ч5е в зависимости от показаний датчика С (см.
рис. И). . .Известная ^задача tfa преследование» (погоня) также является примером следящего, управления. Допустим, что собака Р, в начальный момент времени находящаяся в некоторой точке вертикальной оси z> преследует зайца, который убегает в положительном направлении оси х. Собака постоянно меняет направление, всегда стремясь к точке, в которой в данный -момент находится заяц. Если бы собака меняла направление через какие-то краткие промежутки времени, например ежесекундно, то пройденный ею путь имел бы вид ломаной линии (см. рис. 12а). В пределе, то есть когда собака, непрерывно меняет направление, ломаная линия стремится к непрерывной
fj 6)
Рис. 12.
линии, которая носит название кривой преследования (см. рис. 126). Действительно, кривая преследования отражает процесс следящего управления, ибо ее вид определяется движением убегающего зайца. Ее свойство состоит в том, что касательная к любой точке этой кривой (при пересечении с осью х) указывает точку, в которой в данный момент находится заяц.
Задача на преследование модифицируется, если предположить, что собака не бежит бессмысленно в направлении к тбчке, в которой в данный момент находится заяц, но, как бы опережая зайца, бежит по прямой и старается схватить зайца, достигая кратчайшим путем точки, в которой маршруты погони и бега зайца пересекаются. Такого рода процесс является , примером упреждающего управления (управления с опережением), о котором речь пойдет ниже. В данном- случае такое управление потребовало бы от собаки знания функции w(t) движения зайца. При обычном преследовании без упреждения знать эту функцию не нужно.
Наконец, приведем пример следящего управления применительно к решению экономической проблемы. Как известно из предыдущего параграфа, национальный доход (общая сумма выплат) У может быть выражен в виде функции суммы капиталовложений
У = |Л, где -jzzj есть мультипликатор Кейнса.
Предположим, что нам нужно получить доход Y в таком объеме, чтобы в каждый момент определенного периода (например, пятилетнего) была обеспечена полная занятость населения.
Обозначим через N(t) численность трудоспособного населения на момент t, через P(t) —стоимость продукции на момент t и че-, рез а — коэффициент трудоемкости производства чистой продукции в народном хозяйстве, который принимается неизменным. Примем также, что в течение рассматриваемого периода не изменяется коэффициент потребления с. Задача, которую мы хотим решить, сводится к определению такого объема капиталовложений A(t) на момент который бы всегда обеспечивал полную занятость, то есть чтобы в каждый мо- мент^выполнялось равенство*{.t) = EP~ = P{t) = Y{t).
Если изменяющуюся во времени численность трудоспособного населения N(t) принять в качестве известной ведущей величины, то реціение задачи сводится к определению следящей величины A(t), то есть программы капиталовложений на рассматриваемый период. Из равенства
в итоге получим:
А«) = (\-с)Ш-.
Это упрощенный пример, ибо в нем не учитывается, что в течение более продолжительного периода времени и коэффициент трудоемкости а, и коэффициент потребления с подвержены изменениям и, следовательно, являются функциями времени a (t) и c(t). Однако, зная прогнозы этих величин, задачу на определение величины А (t) можно решить с помощью аналогичного равенства. Получим:
A(t) = [\-c(t)).^.
Это условие должно удовлетворяться в каждый момент t
Ёсли величина A(t) рассчитывается по этой формуле на каждый отдельный момент t с учетом существующих на эта моменты значений N(t)y то мы имеем дело с обычным следящим управлением. Однако, пользуясь демографическими прогнозами, можно определить будущие значения N(t) на некоторый период (например, на 5 лет); тогда приведенное выше уравнение позволяет заранее определить необходимые на этот период значения A\t), то есть планировать капиталовложения В этом случае имеет место упреждающее управление. Всякое экономическое планирование есть управление с упреждением.
Рассмотрим теперь третий тип управления. В этом случае отсутствует определенная ведущая величина, а управление должно установить заданное значение г (норму работы системы) на основе предшествовавшего процесса управления.
Иными словами, заданное значение z есть функция состояний (выхода системы.— Ред.) в предшествующие периоды или моменты времени. Это так называемое адаптационное управление.Важным случаем такого управления является про: цесс самообучения, то есть накопления и обобщения выводов из прошлого опыта. Поэтому адаптационное управление в целом часто называют «процессом самообучения». Иногда его также называют «процессом наследования» (hereditary process), ибо в этом процессе как бы «наследуется» приобретенный ранее опыт, и на его основе определяется заданное значение— норма выхода системы.
При адаптационном управлении заданная на момент t величина — обозначим ее через г(*)~есть функция состояний выхода системы (у) на моменты t — 01, t — Э2 ит. д., то есть значений y(t — 0i), y(t — Q2) и т. д. Это можно записать следующим образом:
z{t) = i\y{t-Qx), y(t-Q2),..:].
Существует еще четвертый тип управления, при котором заданная величина (переменная или постоянная) представляет собой максимум или минимум некоторой функции (или функционала). Обычно такая функция (или функционал) содержит уровень настройки х, пропускные способности S и R, а также различные дополнительные параметры. Записывается это в виде z=f(xt S, /?, дополнительные параметры), откуда 2=maxf (х, S, /?, дополнительные параметры) или 2=min f (х, S, /?, дополнительные параметры).
Такой тип управления в случае, если z — постоянная, называется экстремальным или оптимальным управлением
Примером такого управления является описанное выше упреждающее преследование зайца собакой, когда собака, следуя кратчайшей дорогой, настигает зайца, бегущего с известной скоростью по данной трассе (имеющей вид прямой или кривой линии). Другой пример экстремального управления — регулирование скорости вращения вала паровой машины (или турбины) с целью максимизации ее производительности, то есть отношения объема выполненной работы к количеству энергии, израсходованной на приведение машины в действие.
В экономических задачах экстремальное управление чаще всего основывается на таком подборе значения выхода (нормы) системы, при котором издержки по эксплуатации последней сводились бы к минимуму или же доход достигал максимума.Перечисленные типы управления можно обобщить следующим образом. Переменная норма системы регулирования есть функции определенного параметра, который мы назовем критерием управления; обозначив этот параметр через 5, получаем функцию z=f(s). Если указанным параметром является время ($=*), то речь идет о программном управлении. Если этим параметром является величина, определяемая каким- либо иным процессом вне системы регулирования, то речь идет о следящем управлении; этот параметр есть ведущая величина w (s = w). Если таким параметром Является прежнее состояние выхода системы регулирования (или множество таких состояний), то мы говорим об адаптационном управлении. Наконец, если параметр s определяется условием экстремизации maxf(s) или min/(s), то речь идет об экстремальном управлении. Следовательно, отдельные типы управления определяются характером параметра 5 — критерия управления.
При обобщении нашего анализа можно принять, что норма системы регулирования есть, функция многих параметров. Таким образом, критерий управления является многопараметрическим (многофакторным) и можно говорить о комплексном управлении. Напри- Мер, управление может быть программным относи- тельно одного параметра (времени), следящим относительно другого параметра (ведущей величины), адаптационным относительно третьего параметра (зависящего от прежних состояний выхода системы) и экстремальным относительно четвертого параметра (представляющего собой условие минимизации каких- либо затрат или усилий). Такое комплексное управление характеризует развитие живых организмов. Поведение организма (состояние его выходов) зависит от его возраста (то есть от параметра времени), от различных ведущих величин, определяемых внешней средой, от прежнего поведения организма (прошлых состояний его выходов), например, приобретенных условных рефлексов, а также от величин, являющихся следствием определенных экстремальных условий (например, минимизация усилий). Гомеостатическое регулирование выравнивает отклонения от нормы поведения, определяемой перечисленными факторами.
Следует также отметить, что в случае, когда многопараметрический критерий управления включает параметр, удовлетворяющий определенному условию экстремизации, и, кроме того, включает либо время в качестве параметра, либо параметр, определяемый прежними состояниями выхода системы, комплексное управление равнозначно, решению некоторой задачи динамического программирования.
/