Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Общая постановка задачи

Динамическое программирование (ДП) – это метод оптимизации, разработанный для многошаговых операций, т.е. для таких операций, в которых процесс принятия решения может быть разбит на логические этапы. Он применим к задачам с оптимальной подструктурой, выглядящим как набор перекрывающихся подзадач, сложность которых чуть меньше исходной. Ключевая идея в динамическом программировании проста. Как правило, чтобы решить поставленную задачу, требуется решить отдельные части задачи (подзадачи), после чего объединить их решения в одно общее решение. Часто многие из этих подзадач одинаковы. Подход динамического программирования состоит в том, чтобы решить каждую подзадачу только один раз, сократив тем самым количество вычислений.

Словосочетание «динамическое программирование» впервые было использовано в 1940-х годах Ричардом Беллманом (1920-1984) для описания процесса нахождения решения задачи, где ответ на одну задачу может быть получен только после решения задачи, «предшествующей» ей. В 1953г. он уточнил это определение. Первоначально эта область была основана, как системный анализ и инжиниринг, которая была признана IEEE[1]. Вклад Беллмана в динамическое программирование был увековечен в названии уравнения Беллмана, центрального результата теории динамического программирования.

Модели ДП применяются:

– при разработке правил управления запасами, которые устанавливают момент пополнения запасов и размер пополняющего заказа,

– при распределении дефицитных капитальных вложений между возможными направлениями их использования,

– при разработке принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию,

– при составлении календарных планов ремонта оборудования и его замены и т.п.

Сформулируем общую постановку задачи ДП.

Рассматривается управляемый процесс, в результате которого система S переводится из начального состояния s0 в конечное состояние sn. Предполагается, что управление X можно разбить на n шагов и принимать решение на каждом шаге. Следовательно, управление представляет собой совокупность n пошаговых управлений: X=(X1, X2,…Xn). Последовательность состояний системы s0, s1, …, sk-1, sk, sk+1,… sn можно изобразить в виде схемы:

Целевая функция (показатель эффективности системы) зависит как от начального состояния системы s0, так и от управления X:

(4.1)

Необходимо определить такое допустимое управление X, переводящее систему S переводится из состояния s0 в состояние sn, при котором целевая функция (4.1) принимает максимальное (минимальное) значение.

Предполагается, что состояние системы в конце каждого шага зависит только от предшествующего состояния и управления на данном шаге:

(4.2)

Уравнения (4.2) называют уравнениями состояний. Они выражают «отсутствие последействия», т.е. независимость состояния системы в конце каждого шага от состояний и управлений на всех предыдущих шагах.

Целевую функцию считают аддитивной функцией от показателя эффективности каждого шага:

(4.3)

Выбор управления на каждом шаге зависит только от состояния системы к началу данного шага, не влияет на предшествующие шаги, т.е. в системе нет обратной связи:

(4.4)

Существуют различные методы решения подобных задач, их выбор зависит как от вида целевой функции, так и от наличия и сложности дополнительных ограничений. Рассматриваемая далее схема динамического программирования, основанная на принципе оптимальности Беллмана, не зависит от способа задания целевой функции и ограничений.

<== предыдущая лекция | следующая лекция ==>
Проверка плана на оптимальность. Метод потенциалов | 
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 442; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.039 сек.