КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Модели динамического программирования
Динамическое программирование - один из разделов экономико - математического моделирования, в котором управляемый процесс принятия решений может быть разбит на этапы. Поясним процесс управления следующей схемой: Рис. 13 а) Систему за n шагов нужно перевести из исходного состояния S0 через несколько промежуточных состояний в конечное Sn под действием шаговых управлений. б) Таким образом, каждому состоянию кроме последнего, сопоставляется набор шаговых управлений, под действием каждого из которых система может перейти в следующее состояние. Например, в начале каждого квартала нужно принять решение об обеспечении предприятия сырьем, о замене устаревшего оборудования, о финансировании и т.д. в) Выбранное шаговое управление хк оценивается частным критерием gk, т.е. вычисляется значение gk (хк), называемое выигрышем на к-м шаге. г) Требуется найти такой набор шаговых управлений (назовем его оптимальным), который обращает в максимум суммарный критерий G = g1 + g2 +…..gn. Замечание Вовсе не очевидно, что для нахождения оптимального набора шаговых управлений нужно находить максимум частных критериев. Наоборот, принцип оптимальности Беллмана утверждает, что шаговое управление на каждом шаге выбирается так, чтобы максимизировать не только этот шаг, но и все последующие. Тем самым, шаговое управление следует выбирать дальновидно, с учетом его последствий. В этом и состоит принцип Беллмана, относящийся к 50-м годам 20-го века. Пример 1: задача распределения средств. Совет директоров фирмы рассматривает предложения по наращиванию производственных мощностей на четырех предприятиях фирмы. Для расширения производства совет директоров выделяет средства в объеме 200 млн. $. Как же связаны дополнительные средства с наращиванием производственных мощностей? Аналитиками фирмы составлена таблица, в которой указаны возможные приращения мощностей (в денежном выражении) в зависимости от выделенной предприятию суммы: Табл.1
Чтобы воспользоваться методом динамического программирования для оптимизации распределения средств между клиентами, статический процесс искусственно превратим в динамический (многошаговый). Рис. 14 Столбцы в табл. 1 это и есть частные критерии, оценивающие каждый шаг. Следуя принципу Беллмана оптимизацию начинаем с последнего 4- го шага (почему?), затем 3-го и т.д. 1. Оптимизация 4-го шага, т.е. решение задачи: max {g4 (x4) } = (обозначим)= Z 4 (S3) → табл. 2 Табл.2
2. Оптимизация 3-го шага, т.е. решение задачи: max {g3 (x3) + Z 4 (S2 - x3) } = Z 3 (S2) → табл. 3 Табл.3
3. Оптимизация 2-го шага, т.е. решение задачи: max {g2 (x2) + Z 3 (S1 - x2) } = Z 2 (S1) → табл. 4 Табл.4
4. Оптимизация 1- го шага → табл.5 max {g 1 (x1) + Z 2 (S0 - x1) } = Z 1(S0) → табл. 5 Табл.5
5. Обратный ход – окончательный оптимальный набор шаговых уравнений 40 80 40 40 S0 → S1 → S2 → S3 → S4 200 160 80 40 0 ВЫВОД: ПЕРВОМУ КЛИЕНТУ ВЫДЕЛЯЕМ 40, ВТОРОМУ- 80, ТРЕТЬЕМУ- 40, ЧЕТВЕРТОМУ - 40. Максимальная наращенная мощность 24. Пример 2: оптимизация на графе: Транспортная сеть состоит 10 пунктов (рис. 7), некоторые из которых соединены магистралями. Стоимость проезда по каждой из магистралей отмечена на схеме. Найти оптимальный (самый дешевый) путь проезда от 1-го пункта в 10-й.(см. рис. на доске). Решаем задачу методом динамического программирования. Разобьем транспортную сеть на состояния: пункт принадлежит состоянию S1, если из него можно попасть в конечный пункт за 1 шаг. Так пункты {7, 8, 9} S1. По аналогии пункты {5, 6} S2, {2, 3, 4} S3, {1} S4. Начинаем оптимизацию 1-го состояния (почему?). В последний пункт можно попасть за один шаг из пунктов 7,8,9. Их стоимости (этих маршрутов) отмечены, а прямоугольниках. Так для пункта 5: min {6+9, 6+3} = 9. При этом ненужный путь зачеркиваем. Далее оптимизируем 2-е состояние (с учетом принципа Беллмана). В квадратных скобках пунктов 5, 6 отмечаем минимальную сумму попадания в конечный пункт с учетом оптимизации 1- го состояния (этого требует принцип Беллмана!). Продолжая оптимизацию, доходим до 4-го состояния. Далее - обратный ход: отсекая бесперспективные ветви сети, прочитываем оптимальный путь: 1→ 4→ 6→ 8→ 10. Рис. 15
Дата добавления: 2014-12-27; Просмотров: 1011; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |