Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Таким чином отримуємо




Множина можливих траекторій Т визначається способом вибору керувань у станах системи. Найбільш загальний спосіб задання правила для вибору керування полягає у тому, що задається вирішуюча функція (вирішуюче правило), яка визначається таким чином.

Розглянемо функцію h(t), визначену для усіх скінчених траекторій t Î Т. Позначимо стан, у який потрапляє система в результаті проходження траекторії t = ((i0, u0), (i1, u1), …, (ik, uk)), як tip(t) (tip(t) = g(uk)). Функція h(t) називається вирішуючим правилом, якщо для усіх t Î Т h(t) Î Ntip(t).

Будемо говорити, що траекторія t = ((i0, u0), (i1, u1), …, (in, un)) визначається вирішуючим правилом h, якщо для кожного k = 1, n виконується співвідношення uk = h(tk), де tk = ((i0, u0), (i1, u1), …, (i k-1, u k-1)) – скінчена траекторія, співпадаюча з початком траекторії t.

Множину траекторій, що визначаються довільним вирішуючим правилом, позначимо через T0. Назвемо вирішуюче правило стаціонарним, або політикою, якщо для будь-якої траекторії t h(t) = f(tip(t)), тобто керування, визначене вирішуючим правилом, залижить лише від кінцевого стану пройденої частини траекторії. Множину траекторій, що визначаються політиками, позначимо через Tp і розглянемо задачу пошуку максимуму функції F на траекторіях t Î Тp, що починаються у стані i.

Позначимо множину таких траекторій через T(i), а множину траекторій, що починаються з пари (i, u) через T(i, u). Припустимо,

V(i) = max { F(t) | t Î Т(i)}. (16.2)

Оскільки T(i, u), u Î Ni утворюють розбиття множини Т(i): Т(i) = T(i, u),

" u Î Ni

T(i, uj) T(i, uk) = Æ, " uj ¹ uk, то

V(i) = max { max {F(t) | t Î T(i, u)} | u Î Ni }.

Враховуючи, що F(t) рекурентна, для кожної траекторії t Î Т(i, u) можна записати

F(t) = c (u) + b (u) x F(t).

Перший доданок у правій частині має однакове значення для кожної траекторії з T(i, u), тому його можна винести за знак максимуму. Аналогічно можна винести за знак максимуму і множник b (u):

V(i) = max { c (u) + b (u) max {F(t) | t Î T(i, u)} | u Î Ni }.

Для стаціонарного вирішуючого правила множина траекторій t співпадає з множиною T(g(u)), і тому max {F(t) | t Î T(i, u)}= max {F(t) | t Î T(g (u)) } = V(g (u)).

max { c (u) + b (u) V(g (u) | u Î Ni }, якщо Ni ¹ Æ;

V(i) = (16.3)

F(i) при Ni = Æ,

де F(i) значення цільової функції на пустій траекторії, при умові, що система знаходиться у стані i.

Рівняння (16.3) називається рівнянням динамічного програмування або рівнянням Белмана, названим на честь автора динамічного програмування, американського математика Белмана. Ця формула дає змогу обчислювати значення цільової функції на ускладнених траєкторіях, використовуючи значення на спрощенних траекторіях.

Приклад розв’язування задачі методом динамічного програмування.

Розглянемо відому комбінаторну задачу про рюкзак, яка відіграла значну роль у розвитку методів дискретної оптимізації. Спочатку зупинемося на одновимірному варіанті цієї задачі, що формулюється таким чином.

Турист, готуючись до подорожі, збирає рюкзак, у який можна покласти вантаж, сумарною вагою не більше а кг. Цей вантаж може складатися з предметів n типів. Предмет і-го типу (і = 1, n) має вагу аі і цінність сі. Треба визначити кількість предметів кожного типу, які турист повинен покласти у рюкзак, щоб отримати максимальну сумарну цінність предметів.

Побудуємо математичну модель задачі. Уведемо цілі змінні xi – кількість предметів і-го типу, покладених у рюкзак (і = 1, n). Тоді цільова функція приймає вигляд

F = сі xi ® max.

Обмеження на сумарну вагу предметів у рюкзаку можна врахувати за допомогою нерівності

аі xi £ а.




Поделиться с друзьями:


Дата добавления: 2014-01-13; Просмотров: 352; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.