Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Постановка задачи и принцип оптимальности




Метод динамического программирования разработан американскими математиками под руководством Р. Беллмана в начале 60-х годов прошлого века [3].

Рассматривается следующая задача оптимального управления. Состояние ОУ характеризуется вектором состояния . Поведение ОУ описывается уравнением состояния в векторной форме .

Заданы: начальный момент процедуры управления , конечный момент процедуры управления , начальное состояние ОУ . Конечное состояние ОУ не задается, т.е. рассматривается задача со свободным правым концом траектории.

Задан критерий оптимальности

.

Заданы ограничения на управляющее воздействие и вектор состояния:

.

Необходимо найти такое допустимое управляющее воздействие , при котором ОУ переходит из начального состояния в конечное , оставаясь все время в области допустимых состояний , а показатель качества принимает минимальное значение.

Предположим, что задача оптимального управления решена и найдено оптимальное управление и соответствующая ему оптимальная траектория . Изобразим оптимальную траекторию в n -мерном пространстве состояний (рис. 4).

Рассмотрим произвольный момент времени , которому на оптимальной траектории соответствует точка . Она делит оптимальную траекторию на участки 1 и 2. Принцип оптимальности Беллмана утверждает, что второй участок оптимальной траектории сам по себе является оптимальной траекторией.

Это утверждение нужно понимать следующим образом: если за начальный момент времени принять момент времени , а за начальное состояние объекта принять вектор и решать задачу оптимального управления на основании критерия оптимальности

,

то решением этой задачи будет участок 2 оптимальной траектории.

Принцип оптимальности справедлив для любого конечного участка оптимальной траектории. Ни какой начальный или промежуточный участок не является сам по себе оптимальным, если рассматривается задача со свободным правым концом траектории. Так, например, если решать задачу оптимального управления на интервале с начальным состоянием и незаданным конечным состоянием объекта на основании критерия оптимальности

,

то решением этой задачи будет новый участок , а не участок 1.

Принцип оптимальности доказывается методом от противного. Предположим, что принцип оптимальности несправедлив, и можно указать такой участок , на котором показатель качества

принимает меньшее значение, чем на участке 2. Но тогда с самого начала можно было бы организовать управление объектом таким образом, что бы его траектория совпадала сначала с участком 1, а затем с участком . На траектории 1- показатель качества

достигал бы меньшего значения, чем на траектории 1-2. Однако траектория 1-2 является оптимальной, характеризуется минимальным значением показателя качества, и никакой другой траектории с меньшим значением показателя качества существовать не может. Поэтому предположение о наличии участка с указанными свойствами не подтвердилось, а, следовательно, принцип оптимальности справедлив.

Принцип оптимальности имеет и другую формулировку: оптимальное управление в любой момент времени не зависит от предыстории движения объекта, а определяется лишь состоянием объекта в этот момент времени и целью управления.

Принцип оптимальности Беллмана лежит в основе метода динамического программирования.

 




Поделиться с друзьями:


Дата добавления: 2014-11-29; Просмотров: 641; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.014 сек.