КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Пример 2. Одновременно, обоим неравенствам удовлетворяют точки нижней огибающейПример 1. Решить игру:
Рис. 6 Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А? Разумеется, то, при котором нижняя огибающая достигнет максимума. Решаем систему: р = 1/3, 1-p = 2/3, v=5/3 Вывод: если игрок А с вероятностью 1/3 будет выбирать 1 стратегию и с вероятностью 2/3 – 2 стратегию, то при достаточно большом количестве игр с данной платежной матрицей, гарантированный средний выигрыш составит 5/3. Другая интерпретация: чередовать стратегии в пропорции 1:2. Чтобы найти оптимальную стратегию игрока В, воспользуемся первой строкой матрицы: q + 3 (1-q) = v → q = 2/3, 1-q = 1/3 Фирма планирует выпуск двух моделей айфонов (игрок А). Игрок В - спрос на продукцию. Аналитики составили платежную матрицу: Найти оптимальную стратегию игрока А. (почему не интересует игрок В?) Следуем теореме Неймана. а)находим нижнюю и верхнюю цены игры →седловой точки нет. б) пусть (p,1- p) смешанная стратегия игрока А, (q 1, q 2, q 3) смешанная стратегия игрока В. Следуя теореме Неймана имеем: 2 p+ 7(1 -p) ≥ν→- 5 p+ 7 ≥ν (1) 3 p +5(1- p)) ≥ν→- 2 p +5 ≥ν (2) 11 p +2(1- p)) ≥ν→ 9 p +2 ≥ν (3) в) графическая иллюстрация неравенств Рис. 7 Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А? Разумеется то, при котором нижняя огибающая достигнет максимума. Решаем систему: -2 p+ 5=ν 9 p+ 2=ν р = 3/11, 1-p = 8/11, v = 49/11 Вывод: следует порекомендовать выпускать айфоны обеих моделей в отношении 3:8. Чтобы найти оптимальную стратегию игрока В, заметим, что в образовании цены игры участвовали только 2-я и 3-я стратегии игрока В: 3q2 + 11 (1-q2) = 49/11. q2 = 9/11, q3 =2/11, q1=0. 14. Решение игры с нулевой суммой сведением к задаче линейного программирования Покажем, как игру двух лиц с нулевой суммой можно представить задачей линейного программирования и решить, например, симплекс-методом. Пример 1: Решить игру, заданную платежной матрицей α= 1, β= 2 → игра без седловой точки. Пусть (р1, р2) – смешанная стратегия игрока А, (q1, q2, q3) – смешанная стратегия игрока В. Напомним, что суммы вероятностей равны 1. Воспользуемся теоремой Неймана из раздела 12. Для игрока А: 3р1 + р2 ≥ v 3р2 ≥ v р1 + 2р2 ≥ v F = v → max Преобразуем ограничения, разделив все члены неравенств на v (обозначим y1 = р1/v, y2 = р2/v, заметим, что v = 1/(y1 + y2)). Итак, задача принимает вид: 3y1 + y2 ≥ 1 3y2 ≥ 1 y1 + 2y2 ≥ 1 G = y1 + y2 → min (1) Для игрока B: 3q1 + q3 ≤ v q1 + 3q2 +2q3 ≤ v F = v → min Преобразуем ограничения, разделив все члены неравенств на v (обозначим х1 = q1/v, х2 = q2/v, x3= q3/v, заметим, что v= 1/(x1 + x2+x3)). Итак, задача принимает вид: 3x1 + x3 ≤ 1 x1 + 3x2 +2x3 ≤ 1 f = x1+x2+x3 → max (2) Согласно моделям раздела 6 получена пара двойственных задач (1) и (2). Напомним, что, решив одну из них, например, симплекс-методом, мы автоматически найдем решение другой. Итак, решаем задачу (2): 3x1 + x3 +х4 = 1 x1 + 3x2 +2x3 + х5 = 1 F = x1+x2+x3 → max
Получено оптимальное решение: х1 = 1/5, х2 =0, х3= 2/5 v = 1/(x1 + x2 + x3) = 5/3 q1 = 1/3, q2 = 0, q3 = 2/3 Вывод: чтобы обеспечить гарантированный средний проигрыш 5/3 игроку В нужно с вероятностью 1/3 выбрать первую стратегию и с вероятностью 2/3 – третью стратегию (или так- чередовать стратегии 1 и 3 в соотношении 1:2). Чтобы найти оптимальную стратегию игрока А вспомним раздел 6: (в оценочной строке последней таблицы находим абсолютные значения балансовых переменных х4, х5) у1 = 1/5, у2= 2/5 р1 = (1/5)*(5/3)=1/3, р2 = 2/3. Пример 2: (военная игра НАТО) На маневрах флота в средиземном море сторона В может послать подводную лодку в один из регионов моря: 1 или 2. Другая сторона А имеет 3 противолодочных корабля и должна обнаружить и уничтожить подводную лодку. Вероятность корабля потопить лодку в регионе 1 равна 0,6, а в регионе 2 - 0,4. Командованию флота нужно разработать стратегию распределения кораблей по регионам. Данную конфликтную ситуацию рассмотрим как игру двух игроков А и В. У игрока В две стратегии - послать лодку в регион 1 и в регион 2. У игрока А четыре стратегии (0,3), (1,2), (2,1) и (3,0). Например, (2,1) означает посылку двух кораблей в 1 регион и одного - во 2 регион, и т.п. Выигрыш игрока А – вероятность уничтожения лодки. α=0,6, β=0,784 Поясним составление платежной матрицы. (0,3)- посылка 0 кораблей в 1 регион и 3 кораблей во второй. При этом в первом регионе имеется лодка - ясно, что вероятность ее уничтожения 0. Пусть игрок В направил лодку во 2 регион: вероятность того, что хотя бы один из 3-х кораблей уничтожит лодку: р = 1 – (1- 0,4)3 =0,784. (2,1)- посылка 2 кораблей в 1 регион и одного корабля во 2 регион. Пусть игрок В направил лодку в 1 регион: Р = 1- (1-0,6)2 = 0,64 и т.д. (просчитать вероятности самостоятельно). Рассуждая, так же как и в первом примере: Для игрока А: 0,6у2 + 0,84у3 + 0,936 у4 ≥ 1 0,784у1 + 0,64у2 + 0,4 у3 ≥ 1 F = у1 + у2 + у3 + у4 → min (1) Для игрока В: 0,784х2 ≤ 1 0,6х1 + 0,64х2 ≤ 1 0,84х1 + 0,4х2 ≤ 1 0,936х1 ≤ 1 G= x1 + x2 → max (2) Решим задачу (1) в EXCEL. (файл игра). у1 =0, у2= 1,48, у3=0,13, у4=0, v= 1/(у1+у2 + у3 + у4)= 1/1,61 = 0,62 р1=0, р2 =1,48*0,62= 0,92, р3=0,13*0,62= 0,08, р4 =0 Итак, оптимальная стратегия игрока А – послать 1 корабль в 1-й регион с вероятностью 0,92 и 2- в 1 регион с вероятностью 0,08. Не следует посылать 3 корабля во 2 -й регион и 3 корабля в 1 регион! Пример 3. Найти решение игры, заданной платежной матрицей: Решаем игру сведением к двойственным задачам. Для игрока А: 4у1 + 3у2 + 2 у3 ≥ 1 -2у1 + 5у2 + у3 ≥ 1 2у1 + у2 + 5у3 ≥ 1 G = у1 + у2 + у3 → min (1)
Для игрока В: 4х1 – 2х2 + 2х3 ≤ 1 3х1 + 5х2 + х3 ≤ 1 2х1 + х2 + 5х3 ≤ 1 F = х1 + х2 + х3 → max (2)
Решим задачу (1) в EXCEL: у1 = 0,03 у2 = 0,19 у3= 0,15 v= 1/ (0,03 + 0,19 + 0,15)= 2,7 р1 = 0,03*2,7=0,081 р2 = 0,19*2,7 =0,513 р3 = 0,15*2,7 =0,405
Наиболее обещающей для игрока А является 2-я стратегия. Решим задачу (2) в EXCEL: х1 = 0,22 х2 = 0,05 х3= 0,1 v= 1/ (0,22 + 0,05 + 0,1)= 2,7 q1 = 0,22*2,7=0,594 q2 = 0,05*2,7 =0,135 q3 = 0,1*2,7 =0,27
Дата добавления: 2014-12-27; Просмотров: 521; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |