Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Идея метода




Введем в рассмотрение новую координату состояния , удовлетворяющую дифференциальному уравнению

, (3)

которое учитывает подынтегральную функцию в функционале (2). Присоединив уравнение (3) к системе (1) получим систему уравнений:

, , (4)

Запишем систему (4) в векторной форме, для чего введем в рассмотрение (n+1)-мерный вектор координат состояния . Тогда в векторной форме система уравнений (4) примет вид:

, (5)

где – вектор правых частей системы (4), причем правые части не зависят от координаты .

Обозначим в (n+1)-мерном пространстве состояний через точку с координатами . Пусть – некоторое допустимое управление, для которого соответствующая фазовая траектория системы (1) проходит при через точку , а при – через точку . Из уравнения (3) следует, что координата

.

При эта координата

Таким образом, в пространстве фазовая траектория системы (5) при этом управлении проходит при через точку , а при через точку . Тогда задачу оптимального управления можно сформулировать так:

Для системы следует выбрать такое управление, чтобы координата принимала бы наименьшее значение, т.к. подразумевается, что отыскивается минимум функционала.

Доказательство метода сводится к доказательству некоторых утверждений:

1. Утверждается принцип оптимальности, что каждый отрезок оптимальной траектории является оптимальным. На основе его показывается, что все неоптимальные траектории проходят выше оптимальной. Если какая-то траектория проходит ниже выбранной, то ее нужно считать за оптимальную. Далее задаются вариации траекторий при воздействии различных вариаций управления. Считается, что найдено оптимальное управление, соответствующее оптимальной траектории.

2. Задается временная вариация управления в течение времени , в конце управления .

Доказывается, что остаток R вариации траектории является малым, а движение при временной вариации будет проходить по касательной в конечной точке (вектор ).

3. Задается игольчатая вариация управления (вариация Макшейна).

 

Эта вариация ограничена. Если , то площадь импульса также , при этом следует ожидать малого отклонения варьированной траектории от оптимальной.

В принципе максимума доказывается, что варьированные траектории будут выше оптимальной и они получаются путем сдвига оптимальной траектории на величину .

.

Дается множество игольчатых вариаций, от каждой вариации получается вектор смещения . Все векторы смещения переносятся в конечную точку. На векторы смещения натягивается оболочка – получается конус векторов смещения .

4. Полученный конус векторов смещения от игольчатых вариаций растягивается по направлению вектора от временной вариации. Полученный конус не заполняет всего (n+1)-мерного пространства. Т.к. конус построен на вариациях, то оптимальная траектория не попадает в этот конус. Раз так, то этот конус можно отделить от траектории некоторой плоскостью. Эту плоскость характеризует вектор , нормальный к плоскости. Вектор же лежит в этой плоскости, т.е они перпендикулярны и их скалярное произведение равно нулю. С учетом , получим:

.

В ПМ также доказывается, что векторы и перемещаются вдоль траектории и всегда перпендикулярны, т.е. их скалярное произведение должно быть равно 0.

Определение вспомогательной вектор-функции .

Стоит задача – выразить функцию через уравнения связи.

1. Запишем неоптимальную траекторию через оптимальную и вариацию.

и подставим в уравнение связи.

, (*)

записывается без вариации , т.к. в ПМ доказывается, что при на порядок ниже, чем вызванная им вариация .

Разложим правую часть уравнения (*) в ряд Тейлора и воспользуемся только линейной частью разложения:

, (**)

где в (n+1)-мерном пространстве, в n-мерном пространстве.

2. Потребуем, чтобы скалярное произведение векторов

, (***)

вдоль описанной траектории. Из ПМ было видно, что , поэтому условие (***) более слабое, чем равенство 0 этого произведения.

3. Далее попытаемся найти вектор-функцию

Сначала определим вектор для чего рассмотрим следующее. Приращение функционала относительно оптимальной траектории

,

что ясно из доказательства ПМ. Видно, что . Приращение идет по линии П, нам важно знать только направление . Для проварьированной траектории примем равной 1 > 0. Т.е. возьмем . Потребуем, чтобы скалярное произведение

,

что возможно при .

4. Для нахождения вспомогательных функций продифференцируем по времени уравнение (***):

.

5. Запишем последнее уравнение не в векторной, а в координатной форме:

.

Т.к. , то , т.е. вторую сумму можно записать как

.

Воспользовавшись (**), получим:

.

Из этого можно записать уравнения для :

. (6)

Следует отметить, что уравнения связи в (n+1)-мерном пространстве (5) и уравнения для вспомогательных переменных (6) можно объединить одной формой записи. Для этого вводится т.н. функция Гамильтона переменных , , :

.

Тогда предыдущие системы уравнений можно записать

,

,

и – непрерывны и всюду, кроме точек разрыва, имеют непрерывную производную.

При фиксированных значениях и функция становится только функцией управления . Обозначим через

.

Основная теорема ПМ звучит так:

Пусть , где – такое допустимое воздействие, что соответствующая ему фазовая траектория исходящая в момент из , проходящая в момент через некоторую точку прямой П.

Для оптимальности управления и траектории необходимо существование такой ненулевой непрерывной вектор-функции , соответствующей функциям и и удовлетворяющей уравнению

или (6),

что:

1. при любом функция достигает по максимума, т.е. .

2. в конечный момент времени имеет место соотношение

, а .

Если процесс оптимален, то эти условия выполняются на всей траектории.

 

Рассмотрим пример на применение ПМ.

Для объекта с граничными условиями , требуется найти , минимизирующее функционал

.




Поделиться с друзьями:


Дата добавления: 2015-04-29; Просмотров: 423; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.029 сек.