КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Принцип оптимальності Беллмана
Ще раз підкреслим, що зміст підходу, реалізуемого в динамічному програмування, заключаеться в заміні рішення початкової багатомірної задачі послідовності задач меношої розмірності. Перерахуємо основні вимоги до задач, виконання яких дозволяє застосовувати даний підхід:
· Об’єктом дослідження повинна служити управляєча система (об’єкт) з заданими допустимими станами і допустимим управлінням; · Задача повинна дозволяти інтерпретацію як багатокроковий процес, кожен крок якого складається із прийняття рішення про вибір одного із допустимих управлінь, що приводить до змінення стану системи.; · Задача не повинна залежати від кількості кроків і бути визначеною кожному з них; · Стан системи на кожному кроці повинен описуватись однаковим (по складу) набором параметрів; · Наступний стан, в якому є система після вибору рішення на Розглянемо варіанти застосування моделі динамічного програмування в узагальненому вигляді. Нехай стоїть задача управління деяким абстрактним об’єктом, який може перебувати в різних станах. Поточний стан об’єкту ототожнюється з деяким набором параметрів, що позначаються в подальшому Ефективність управління на кожному кроці Основний принцип динамічного програмування заключається в тому, що на кожному кроці слід прагнути не до ізольованої оптимізації функції
Рис. 5.1
оптимальне управління
Позначимо
Співвідношення (5.14) називають основним рекурентним співвідношенням динамічного програмування. Воно реалізує базовий принцип динамічного програмування, відомий також як принцип оптимальності Беллмана: ü Оптимальна стратегія управління повинна задовольняти наступній вимозі: який би не був початковий стан Основне співвідношення (5.14) дозволяє знайти функції
Порівняння рекурентної формули (5.14) з аналогічними співвідношеннями в розглянутому вище прикладах вказує на їх зовнішню різницю. Ця різниця обумовлена тим, що в задачі розподілення ресурсів фіксованим являється кінцевий стан управляє мого процесу. Тому принцип Беллмана застосовується не для наступних, а до початкових етапів управління, і початкове співвідношення має вигляд:
Важливо ще раз підкреслити, що сформульований вище принцип оптимальності застосуємо тільки для управління об’єктами, у якого вибір оптимального управління не залежить від передісторії управляє мого процесу, тобто від того, яким шляхом система пришла в поточний стан. Саме ця обставина дозволяє здійснити декомпозицію задачі і зробити можливим її практичне рішення. В той же час, говорячи про динамічне програмування як про метод рішення оптимізаціонних задач, необхідно відмітити і його слабкі сторони. Так, в запропонованій схемі рішення задачі (5.3)-(5.4) суттєвим образом використовується той факт, що система обмежень має тільки одне рівняння, і, як наслідок, її стан задається одним числом – нерозподіленим ресурсом Окремо відмітимо, що дані обчислювальні схеми, взагалі говорячи, достатньо часто використовуються для рішення деяких задач, які вже були затронуті в інших розділах. Це, перш за все, задача про рюкзак, задача про найкоротший шлях, задачі транспортного типу. Одним із важливих класів задач, для яких застосування динамічного програмування виявляється плодючим, являються задачі наслідкового прийняття рішення. Їх особливістю є те, що шукані змінні В даній задачі розглядається деякий економічний об’єкт (фірма, магазин, завод….), що функціонує на протязі деякого числа періодів, що позначаються номерами
План задачі (стратегія управління)
На основі сфотрмульованої моделі ставиться задача мінімізації цільової функції (витримок) (5.15). добавимо, що постановка задачі не буде коректною, якщо не задати початкову умову на кількість робітників. Існує дві модифікації задачі, що визначаються типом початкової вимоги: в першому випадку задається початкове значення на першому етапі
Дата добавления: 2013-12-14; Просмотров: 1927; Нарушение авторских прав?; Мы поможем в написании вашей работы! |