Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Методы решения задач динамического программирования




1) Метод прямого хода

2) Метод обратного хода

Процесс нахождения решения разбивается на 2 стадии условную и безусловную оптимизацию.

На этапе условной оптимизации для каждого шага определяется условное оптимальное управление и условный оптимальный выигрыш, на всех шагах начиная с данного и до последнего включительно, в методе обратной прогонки, или с 1го до данного включительно в методе прямой прогонки.

На этапе безусловной оптимизации для каждого шага находится безусловное оптимальное управление и max значение W. Безусловная оптимизация в методе обратной прогонки идет от 1го шага к последнему.

В методе прямой прогонки наоборот условная от 1 к последнему, безусловная от последнего к первому.

3) Метод обратной прогонки

При нахождении управления на каждом шаге нельзя исходить из интересов шага в отдельности. Необходимо исходить из всего процесса в целом.

Принцип оптимальности Беллмана:

Какого бы ни было состояние системы к очередному шагу, управление на этом шаге нужно выбирать так, чтобы сумма выигрыша на этом шаге и оптимальна на всех последующих шагах была max.

Wi(Si-1) – условный оптимальный выигрыш на всех шагах от i до n при условии, что к i шагу состояние системы будет Si-1.

Ui* - условное оптимальное управление на i шаге, который совместно с оптимальным управлением на всех последующих шагах достигал max W(Si-1).

Рассмотрим i-шаг.

Предположим, что за предыдущий (i-1)-шаг система пришла в состояние Si-1.

Выберем произвольное управление Ui на i-шаге.

В результате этого управления на i-шаге будет получен выигрыш fi(Si-1, Ui).

Кроме того, система перейдет в новое состояние Si, которое представляет собой функцию Si = φ(Si-1, Ui) – уравнение состояний.

Оптимальный выигрыш на всех последующих шагах при условии, что к (i+1)-шагу состояние системы будет Si составит Wi+1(Si).

Сумма выигрыша на i-шаге и оптимум на всех последующих шагах будет = fi(Si-1, Ui)+Wi+1(Si).

Согласно принципу Беллмана, управление Ui нужно выбрать так, чтобы полученная сумма была maх, то управление, при котором достигается max этой суммы и будет являться условным оптимальным управлением на этом шаге, т.е. Ui*.

Max этой суммы достигает условный оптимальный выигрыш на всех последующих шагах, начиная с i до n – включительно, при условии, что к i-шагу состояние было Si-1.

Wi(Si-1) = max {fi(Si-1,Ui) + Wi+1(Si)} – основная функция управления.

Отдельно функция управления записывается для последнего шага

Wn(Sn-1) = max {fn(Sn-1,Un)}

Max берется по всем управлениям Un, которые приводят систему S в Sn = φ(Sn-1, Un) ℮ на этапе условной оптимизации необходимо найти Wn(Sn-1), Un*, Wn-1(Sn-2), Un-1*…W1(S0), U*.

Безусловная оптимизация.

S0 – задано

W1(S0) = Wmax

 

S0 ℮

Wmax = max W1(S0)=W1(S0*)

 

 

Sn ℮ – множество конечных состояний

 

 

Таким образом, для построения модели динамического программирования, а так же для решения необходимо выполнить следующее.

1) Выбрать способ деления процесса управления на шаги

2) Для каждого шага определить Ui и параметры состояний системы Si

3) Записать уравнение состояний Si= φ(Si-1, Ui)

4) Для i-шага записать выигрыш, соответствующий выбранному управлению Ui

5) Записать функцию управления

Wi(Si-1) = max {fi(Si-1,Ui) + Wi+1(Si)}

Wn(Sn-1) = max {fn(Sn-1,Un)}

6) Провести условную оптимизацию

Wn(Sn-1), Un*, Wn-1(Sn-2), Un-1*…W1(S0), U*.

7) Провести безусловную оптимизацию

 

 

4) Метод прямой прогонки

Уравнение состояний

Si-1 = φ(Si, Ui)

Функциональное уравнение:

Zi(Si) = max fi(Si, Ui)+Zi-1(Si-1)

Zi(Si) – условный оптимальный выигрыш на всех шагах с 1 по i-й включительно

Условная оптимизация от 1 шага к последнему, безусловная – от последнего к 1-му.

5) Венгерский алгоритм

В основе метода 2 утверждения:

1) Если решение xij является оптимальным решением для задачи о назначениях, то оно является оптимальным и для задач с функциями

f’=

c’ij=cij - Vj – Ui (V и U – некоторые константы)

Ограничения вспомогательной задачи совпадают с ограничениями исходной.

2) Если функции f’= , сij ≥ 0 и можно найти такой набор значений переменных xij, для которых сумма =0, то это решение является оптимальным.

Таким образом, метод сводится к добавлению и вычитанию констант к строкам или столбцам, до тех пор, пока количество коэффициентов c’ij, а именно n не станут = 0, что и даст оптимальное решение поставленной задачи.

 




Поделиться с друзьями:


Дата добавления: 2015-04-23; Просмотров: 1592; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.018 сек.