Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Сделаем два предположения

1. Состояние (Sk) системы в конце K-го шага зависит только от предшествующего состояния Sk-1 и управления на K шаге Хк (и не зависит от предшествующих состояний и управлений). Это требование называется "отсутствием последействия". Сформулированное положение записывается в виде уравнений

, (2)

которые называются уравнениями состояний.

2. Целевая функция (1) является функцией от показателя эффективности каждого шага. Обозначим показатель эффективности K-го шага через

, (3)

 

тогда

(4)

Задача динамического программирования пошаговой оптимизации формулируется так: определить такое допустимое управление X, переводящее систему S из состояния S0 в состояние S1, при котором целевая функция (4) принимает наибольшее (наименьшее) значение.

 

Выделим особенности модели динамического программирования:

- задача оптимизации интерпретируется как n- шаговый процесс управления;

- целевая функция равна сумме целевых функций каждого шага;

- выбор управления на k шаге зависит только от состояния системы к этому шагу и не влияет на предшествующие шаги (нет обратной связи);

- состояние Sk после k-го шага управления зависит только от предшествующего состояния Sk-1 и управления Хк (отсутствие последействия);

- на каждом шаге управление Хк зависит от конечного числа управляющих переменных, а состояние Sk - от конечного числа параметров.

 

Существуют различные способы решения подобных задач, применяемые в зависимости от вида функций, ограничений, размерности и т.

 

Принцип оптимальности, впервые сформулированный Р. Беллманом (в 1953г.), формулируется следующим образом: каково бы ни было состояние S системы в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный.

 

Беллманом сформулированы и условия, при которых принцип верен. Основное требование - процесс управления должен быть без обратной связи, т.е. управление на данном шаге не должно оказывать влияния на предшествующие шаги.

 

Принцип оптимальности утверждает, что для любого процесса без обратной связи оптимальное управление таково, что оно является оптимальным для любого под процесса по отношению к исходному состоянию этого под процесса. Поэтому решение на каждом шаге оказывается наилучшим с точки зрения управления в целом.

 

В качестве исходной задачи динамического программирования с фиксированным числом шагов n и начальным состоянием S0 можно рассматривать последовательность задач, полагая последовательно, n=1, 2,... при различных S - одношаговую, двухшаговую и т.д., - используя принцип оптимальности.

 

На каждом шаге любого состояния системы Sk-1 решение Xk нужно выбирать осторожно, так как этот выбор влияет на последующее состояние Sk и дальнейший процесс управления, зависящий от Sk. Это следует из принципа оптимальности.

 

Но есть один шаг, последний, который можно для любого состояния Sn-1 планировать локально-оптимально, исходя только из соображений этого шага.

 

Рассмотрим n -й шаг: Sn-1 - состояние системы к началу n -го шага, Sn= Si -конечное состояние, Xn - управление на n -ом шаге, а (Sn-1, Xn) - целевая функция (выигрыш) n -го шага.

 

Согласно принципу оптимальности, Xn нужно выбирать так, чтобы для любых состояний Sn-1 получить максимум целевой функции на этом шаге.

 

Обозначим через (Sn-1) максимум целевой функции - показателя эффективности n -го шага при условии, что к началу последнего шага система S была в произвольном состоянии Sn-1, а на последнем шаге управление было оптимальным.

 

(Sn-1) называется условным максимумом целевой функции на n -м шаге и описывается равенством:

(5)

Решение (Sn-1), при котором достигается (Sn-1) называется условным оптимальным управлением на n -м шаге.

 

Задача будет двухшаговой, если присоединим к n -му шагу n-1

 

Для любых состояний Sn-2 , произвольных управлений Xn-1 и оптимальном управлении на n -м шаге значение целевой функции на двух последних шагах равно:

(6)

Согласно принципу оптимальности для любых Sn-2 решение нужно выбирать так, чтобы оно вместе с оптимальным управлением на последнем (n-м) шаге приводило бы к максимуму целевой функции на двух последних шагах. Следовательно, нужно найти максимум выражения (6) повсем допустимым управлениям Xn-1. Максимум этой суммы обозначим ее через (Sn-2) и называется условным максимумом целевой функции при оптимальном управлении на двух последних шагах. Соответствующее управление (Sn-1) на (n - 1)-м шаге называется условным оптимальным управлением на (n -1)-м шаге.

(Sn-2)=

(7)

Выражение, состоящее в фигурных скобках (7), зависит только от sn-2 и Хn-1, так как sn-1 можно найти из уравнения состояний (2) при k=n-1

sn-1=
и подставить вместо sn-1 в функцию(sn-1).

 
 

 

В результате максимизации только по одной переменной Xn-1 согласно уравнению (7) вновь получаются две функции:

(Sn-2) и (Sn-2)

Далее рассматривается трехшаговая задача: к двум последним шагам присоединяется (n-2)-й и т. д.

 


[1] Капитальные вложения – затраты материалов, труда и других ресурсов, направленные на восстановление и прирост основных фондов.

[2] Перевооружение – процесс повышения технического уровня производства путем внедрения новой техники, технологии, модернизации, замены, автоматизации производства.

[3] Интенсивный – отражает использование основных фондов, отражает уровень их использования по мощности (производительности.

[4] Экстенсивный – по времени.

[5] Априорный – с лат., независимый от опыта, предшествующий опыту.

[6] Функционалы – математическое понятие, для обозначения переменной величины, заданной на множестве функции.

[7] Вариация – от латинского изменение, - смещение независимого переменного или функционала.

<== предыдущая лекция | следующая лекция ==>
Тема 17. Динамическое программирование | Линейный тракт радиоприемника
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 369; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.