Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Теория игр. Динамическое программирование




Динамическое программирование

Нелинейное программирование

Линейное программирование

Основные виды моделей и методов принятия решений

Общий вид моделей линейного программирования:

F(X) = c1*x1 + c2*x2 + … + cN*xN => max/min – линейная целевая функция

a11*x1 + a12*x2 + … + a1N*xN <= b1 – система линейных ограничений

a21*x1 + a22*x2 + … + a2N*xN >= b2

aN1*x1 + aN2*x2 + … + aNN*xN = bN

x1, x2, …, xN >= 0

Пример 1. Задача об использовании ресурсов (задача планирования производства). Для изготовления 2 видов продукции используют 4 вида ресурсов. Известны затраты ресурсов на изготовление единиц продукции каждого вида и прибыль, получаемая от единицы продукции. Необходимо составить такой план производства продукции, при котором прибыль от ее реализации будет максимальной.

Пример 2. Транспортная задача. Имеется несколько поставщиков и потребителей с известными объемами предложения / спроса. Известна стоимость перевозки единицы продукции от каждого из поставщиков к каждому из потребителей. Необходимо найти такой план перевозок, чтобы перевезти все произведенные товары от поставщиков к потребителям и при этом минимизировать транспортные расходы.

При решении данных задач используется симплекс-метод и его модификации, а также специализированные методы решения транспортных задач. Симплекс-метод разработан независимо американцем Дж. Данцигом (1949) и советским математиком Леонидом Витальевичем Канторовичем (1939).

Одной из разновидностей моделей линейного программирования являются целочисленные модели: одна или несколько переменных по смыслу задачи могут быть только целыми числами и округление неправомерно (рабочие, станки и т.п.). Используется метод отсечения (Гомори) и метод ветвей и границ.

 

Либо целевая функция, либо система ограничений, либо они обе нелинейны. Используются метод множителей Лагранжа, квадратичное программирование и др.

 

Решение проблемы состоит из нескольких этапов (элементов), и решение на каждом последующем этапе зависит от ранее принятых решений.

 

Теория игр помогает принимать решения в условиях неопределенности. Моделирует игровые ситуации, в которых 2 или более стороны (игроки) преследуют различные цели, а результаты любого действия каждой из сторон зависят от действий партнеров. Так как цели различны, то возникает конфликт между ними, и часто выигрыш одного игрока означает проигрыш другого. Эти ситуации часто случаются на практике (шахматы, домино, карты, военные действия, взаимоотношения поставщик – потребитель, банк – клиент, покупатель – продавец и т.п.). Иногда противоположным игроком считают Природу (которая вредит как может) – так называемые игры с Природой (игра в рулетку, игра на бирже и т.п.).

Для простоты будем рассматривать парные (участвуют 2 игрока) антагонистические (выигрыш одного игрока равен проигрышу другого) игры. Игра проходит следующим образом. На каждом этапе игроки делает по одному ходу. Личный ход – сознательный выбор игроком одного из возможных действий. Случайный ход – случайно выбранное действие. Стратегия игрока – совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации. Цель игроков – найти оптимальные стратегии (дающие максимальный выигрыш / минимальный проигрыш). Если игра состоит из нескольких этапов, то максимизируют средний выигрыш / минимизируют средний проигрыш.

Для каждого игрока можно составить платежную матрицу (матрицу игры). Пусть игру ведут игроки A и B. Построим платежную матрицу для игрока A. Ход игрока A соответствует выбору строки матрицы, ход игрока B – выбору столбца. На пересечении выбранной строки – столбца находится выигрыш игрока A (равный проигрышу игрока B). Например:

 

  B1 B2 B3 B4
A1        
A2        
A3        

 

Игрок A стремится максимизировать свой выигрыш, а игрок B – уменьшить его (навредить). Для любой строки, выбранной игроком A, игрок B будет выбирать столбец, дающий наименьший выигрыш игроку A. Для строки 1 – столбец 1 или 2 (выигрыш 3), для строки 2 – столбец 4 (2), для строки 3 – столбец 4 (4). Игрок A выберет в итоге строку 3, которая дает ему наибольший выигрыш при вреде со стороны игрока B (4). Это гарантированный выигрыш игрока A при любой стратегии игрока B. Он называется также нижней ценой игры или максимином.

Если поменять теперь роли игроков, то можно определить по аналогии гарантированный проигрыш игрока B – верхнюю цену игры или минимакс. Для любой столбца, выбранного игроком B, игрок A будет выбирать строку, дающую наибольший проигрыш игроку B. Для столбца 1 – строку 2 (проигрыш 9), для столбца 2 – строку 2 (10), для столбца 3 – строку 1 (6), для столбца 4 – строку 1 (8). Игрок B выберет в итоге столбец 3, который дает ему наименьший проигрыш при вреде со стороны игрока A (6).

Если бы нижняя и верхняя цены игры совпадали, то игра имела бы седловую точку, и игроки всегда выбирали бы один и тот же ход, т.е. имели бы чистые оптимальные стратегии. Но цены игры не совпадают, поэтому игроки должны выбрать в качестве оптимальных смешанные стратегии (содержат вероятность выбора каждой из строк / столбцов игроками на каждом этапе игры).

Задачи теории игр решаются с использованием методов линейного программирования.

 




Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 1407; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.