КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Прямая процедура
Воспользуемся результатами попятной процедуры для решения исходной задачи, то есть для построения оптимального управления и оптимальной траектории при заданном начальном условии (3). Полагая t = 0 и х = х°в (8), найдем управление в начальный момент: u(0) = v0(х°). Далее из соотношения (2) определим состояние х(1) = f(х°, u(0)). Продолжая этот процесс, найдем u(1) = vt(х(1)), х(2)) и т.д. Вообще имеем u(t)=vt(x(t)), x(t+1)=f(x(t),u(t)), x(0)=x0, t=0,1,…., N-1 (9) Соотношения (9) определяют прямую процедуру и позволяют полностью рассчитать оптимальное управление и оптимальную траекторию. Минимальное значение критерия оптимальности, отвечающее этой траектории, J= S(x°, 0). Пример В качестве примера рассмотрим модельную задачу об оптимальном функционировании фермы по разведению скота или птицы. Пусть х - число животных (или птиц) на ферме в начале некоторого интервала времени. Из этого числа их животных отправляется на продажу, а остальные животные приносят приплод, так что их число возрастает в q раз за рассматриваемый интервал. Уравнение (2) примет вид x(t+1)=q[1-u(t)]x(t), t=0,1,... Здесь q > 1 — постоянный коэффициент, и — управляющее воздействие (доля животных, отправляемых на продажу). Ограничение (1) в данном случае имеет вид 0 <=u<=1. Расходы на содержание животных примем пропорциональными их оставшемуся числу и равными а[1 - u(1)]х(t) где а > 0 — постоянная; Выручку от продажи считаем равной сu(t)x(t), где с - цена одного животного на рынке. Поставим задачу максимизации дохода фермы за N шагов по времени. Как отмечалось выше, эта задача эквивалентна минимизации убытка (то есть дохода со знаком минус). Критерий оптимальности имеет вид (4), где нужно принять в соответствии со сказанным выше R(x,u)=a(1-u)x-cux, F(х)=-сх. (11) Последнее равенство (11) определяет (со знаком минус) стоимость животных на ферме в конце процесса. Учитывая соотношения (10) и (11), составим уравнение (6) для рассматриваемой задачи S(x,t)=тin[а(1-и)х-сих+S(q(1-u)x,t+1)] (12) 0<=u<=1
Условие (7) с учетом (11) примет вид S(x,N)= -сх (13) Несложный анализ позволяет реализовать попятную процедуру и построить функции S(x,t) и соответствующие им управления из (9) для задачи (12), (13). Приведем окончательные результаты: S(x,t)=a(qN-1-1)(q-1)-1x-cqN-1 x vt(x)= 0 при a<c(q-1); S (x,t)=-cx vt(x)=1 при a>c(q-1) (14) В том, что функции из (14) удовлетворяют уравнению (12) и условию (13) при всех t, можно убедиться методом математической индукции, проводя ее в сторону убывания t и начиная t=N. Решения (14) допускают простую интерпретацию. Если а < с(q -1), то есть расходы на содержание животных сравнительно невелики, то имеет смысл не направлять животных на продажу (u) = 0) и получить наибольший доход, сохранив все поголовье к концу процесса. Если же а > с(q -1), то есть расходы на содержание велики, то целесообразно отправить на продажу сразу всех животных. В случае а = с(q — 1) оптимальное управление неединственно: в этом случае любое управление приводит к одному и тому же результату. Более сложные и более содержательные результаты получим, если учтем зависимость рыночной цены с от числа продаваемых животных х (цена убывает с ростом х), а также зависимость расходов на содержание одного животного а от числа животных на ферме. НЕПРЕРЫВНОЙ СЛУЧАЙ. Рассмотрим далее случай детерминированной динамической системы с непрерывным управлением без ограничения на состояния
Управление u(t) выбираем из класса допустимых, так что u U и
где α - носит название "коэффициента актуализации", с математической точки введение этого коэффициента позволяет рассматривать случай когда T=+¥. "Экономическая" интерпретация этого коэффициента становится ясной, если учесть разный вклад величин f(t,u(t),y(t)) из-за величин t: сначала и предположить, например, если f=1, т.е., введение коэффициента α, называемого коэффициентом дисконтирования, позволяет описать инфляционные процессы. Определим функцию
где функционал зададим как значение целевой функции для динамической системы в момент времени t, занимающий положение x в фазовом пространстве если управление u(t) допустимо и известно. Реализуем непрерывный аналог вывода реккурентного состношения принципа динамического программирования Беллмана. Пусть на отрезке , δ<<1 реализовано управление v(s), sÎ Состояние y(t+δ) доступно наблюдению, тогда
Пусть нам известно оптимальное управление u(s) с момента t+d Тогда
Теперь на основании принципа оптимальности Беллмана можно записать Где нижняя грань определяется по функциям J(.), реализующим допустимое управление (гарантирующее переход системы из точки (x,t) в точку y(t+d) в момент времени t+d). Разложим функцию Ф(y(t+d),t+d) по степени малого параметра d: Вынесем из квадратных скобок величины, от υ не зависящие Поделим на δ и перейдем к пределу при δ -> 0, тогда
Это нелинейное уравнение с частными производными называется уравнением динамического программирования или уравнением Гамильтона-Якоби-Беллмана. Здесь мы воспользовались определением производной
для замены уравнений движения динамической системы. Привлекая условие Ф(T,x(T))=j(x(T)) получаем несколько необычную задачу для определения функции Ф(x,t): В математической теории оптимального управления устанавливается корректность этой задачи для функции Ф(x,t). Построение алгоритма управления требует некоторого уточнения. Значение оптимального управления в каждый момент времени t есть правило (алгоритм) от имеющейся в этот момент информации. Если динамическая система наблюдаема, то к моменту времени t мы располагаем информацией о состоянии динамической системы и управлением во все предшествующие моменты времени. Будем называть управление обратной связью, если оптимальное значение управления в момент времени t зависит лишь от состояния ДС в этот момент, т.е. от y(t). Одним из основных результатов математической теории управления состоит в том, что при полной наблюдаемости ДС существует управление, которое является обратной связью. В нашем случае (непрерывное управление динамическими системами) синтезируется следующим образом. Пусть нижняя точная грань в скобках, где u,x считаются параметрами, реализуется на функции V(x,s) тогда оптимальное управление v(t) можно задать равенством: v(t)=V(y(t),t) Т.е. управление зависит от текущего состояния динамической системы и поэтому является обратной связью! Если рассматривать непрерывное управление динамическими системами со случайными факторами, то уравнение Беллмана приводится к виду
Случай импульсного управления. Рассмотрим случай детерминированной ДС с импульсным управлением, для простоты без ограничений. Здесь встает вопрос: когда нам выгодно осуществлять управляющий импульс и какова должна быть его интенсивность. Функционал качества (критерий) целевая функция записывается в виде
Рассмотрим сначала интервал (t,t+δ), свободный от управляющих импульсов. Тогда определяя функцию
Имеем свободные движения на интервале t,t+ δ. При этом
так как нижняя грань берется по более широкому интервалу [t,T], а не [t+ δ,T]! Тогда
(если t несвободна от импульсов, то <0!) Пусть теперь в момент времени t система испытывает мгновенный управляющий импульс. Значит система из положения x перешла в положение x+x. До импульса была стоимость Ф(x,t) после стала Ф(x+xit)+C(x). По определению Ф можем написать: Для свободной точки это условие ! А поскольку должно в любой момент времени tÎ[t,t+δ] реализовываться либо одно, либо другое, то одно из неравенств должно перейти в равенство, что можно записать в виде:
И к нему необходимо добавить конечное условие
Таким образом импульсное управление ДС приводит к задаче не для дифференциального уравнения, а к задаче для неравенства, называемого вариационным! Тематика импульсного управления интенсивно развивается. В частности есть обнадеживающие результаты в области управления производством электроэнергии, управления запасами, финансами, производством сырьевыми ресурсами, в задачах управления качеством с учетом износа, статистического управления в финансах, банковским портфелем (управление акциями), задачах распределения дивидендов в проблеме разорения. Пример. Применение импульсного управления к задаче терапевтического лечения. Пусть X(t)- “уровень” болезни в момент времени t. В отсутствие лечения состояние больного эволюционирует согласно уравнению:
Рассмотрим последовательность моментов в которые осуществляется лечение. Каждый акт лечения характеризуется его интенсивностью xi. Пока продолжается лечение, состояние x(t) эволюционирует согласно уравнениям:
Однако лечение может оказать вредное воздействие на организм. Пусть y(t)-степень разрушения организма вследствие лечения. Тогда считаем, что состояние y(t) эволюционирует согласно уравнениям:
Где введены ограничения
Предположим, что цель лечения состоит в удержании состояния x(t) в пределах 0£x(t)£x0. Однако речь идет о том, чтобы чрезмерно не разрушать организм лечением, то есть 0£y(t)£y0. Пусть t - первый момент, в который x(t), или y(t) выходит из точки x0 или y0. Мы хотим максимизировать t. Учитывая стоимость одного акта лечения (равную k) ставим другую задачу минимизировать функционал
Где . Второе слагаемое есть цена лечения, производимого в момент . Пусть , тогда эта функция является решением задачи
Отсюда можно вывести оптимальную стратегию лечения! Решение конкретной задачи управления процессом лечения приводят к диаграммам, приведенным ниже: Предоставляем читателю в качестве небольшого упражнения разобраться что избражено на них (какие показатели состояния и в какие моменты проводится лечение).
Дата добавления: 2015-01-03; Просмотров: 429; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |