Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Пример 2. Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей




Пример 1.

Решить игру:

 

Рис. 6

Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А?

Разумеется, то, при котором нижняя огибающая достигнет максимума.

Решаем систему:

р = 1/3, 1-p = 2/3, v=5/3

Вывод: если игрок А с вероятностью 1/3 будет выбирать 1 стратегию и с вероятностью 2/3 – 2 стратегию, то при достаточно большом количестве игр с данной платежной матрицей, гарантированный средний выигрыш составит 5/3.

Другая интерпретация: чередовать стратегии в пропорции 1:2.

Чтобы найти оптимальную стратегию игрока В, воспользуемся первой строкой матрицы:

q + 3 (1-q) = v → q = 2/3, 1-q = 1/3

Фирма планирует выпуск двух моделей айфонов (игрок А).

Игрок В - спрос на продукцию. Аналитики составили платежную матрицу:

Найти оптимальную стратегию игрока А.

(почему не интересует игрок В?)

Следуем теореме Неймана.

а)находим нижнюю и верхнюю цены игры

→седловой точки нет.

б) пусть (p,1- p) смешанная стратегия игрока А, (q 1, q 2, q 3) смешанная стратегия игрока В.

Следуя теореме Неймана имеем:

2 p+ 7(1 -p) ≥ν→- 5 p+ 7 ≥ν (1)

3 p +5(1- p)) ≥ν→- 2 p +5 ≥ν (2)

11 p +2(1- p)) ≥ν→ 9 p +2 ≥ν (3)

в) графическая иллюстрация неравенств

Рис. 7

Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А?

Разумеется то, при котором нижняя огибающая достигнет максимума.

Решаем систему:

-2 p+ 5=ν

9 p+ 2=ν

р = 3/11, 1-p = 8/11, v = 49/11

Вывод: следует порекомендовать выпускать айфоны обеих моделей в отношении 3:8.

Чтобы найти оптимальную стратегию игрока В, заметим, что в образовании цены игры участвовали только 2-я и 3-я стратегии игрока В: 3q2 + 11 (1-q2) = 49/11.

q2 = 9/11, q3 =2/11, q1=0.

14. Решение игры с нулевой суммой сведением к задаче линейного программирования

Покажем, как игру двух лиц с нулевой суммой можно представить задачей линейного программирования и решить, например, симплекс-методом.

Пример 1:

Решить игру, заданную платежной матрицей

α= 1, β= 2 → игра без седловой точки.

Пусть (р1, р2) – смешанная стратегия игрока А, (q1, q2, q3) – смешанная стратегия игрока В.

Напомним, что суммы вероятностей равны 1.

Воспользуемся теоремой Неймана из раздела 12.

Для игрока А:

1 + р2 ≥ v

2 ≥ v

р1 + 2р2 ≥ v

F = v → max

Преобразуем ограничения, разделив все члены неравенств на v (обозначим y1 = р1/v, y2 = р2/v, заметим, что v = 1/(y1 + y2)).

Итак, задача принимает вид:

3y1 + y2 ≥ 1

3y2 ≥ 1

y1 + 2y2 ≥ 1

G = y1 + y2 → min (1)

Для игрока B:

3q1 + q3 ≤ v

q1 + 3q2 +2q3 ≤ v

F = v → min

Преобразуем ограничения, разделив все члены неравенств на v (обозначим х1 = q1/v, х2 = q2/v, x3= q3/v, заметим, что

v= 1/(x1 + x2+x3)).

Итак, задача принимает вид:

3x1 + x3 ≤ 1

x1 + 3x2 +2x3 ≤ 1

f = x1+x2+x3 → max (2)

Согласно моделям раздела 6 получена пара двойственных задач (1) и (2). Напомним, что, решив одну из них, например, симплекс-методом, мы автоматически найдем решение другой.

Итак, решаем задачу (2):

3x1 + x34 = 1

x1 + 3x2 +2x3 + х5 = 1

F = x1+x2+x3 → max

Базисн. перем. х1 х2 х3 х4 х5 вi Оцен. отн.
х4              
х5     2       1/2
Оцен. строка -1 -1 -1        

 

Базисн. перем. х1 х2 х3 х4 х5 вi Оцен. отн.
х4 5/2 -3/2     -1/2 1/2 1/5
х3 1/2 3/2     1/2 1/2  
Оцен. строка -1/2 1/2     1/2 1/2  

 

Базисн. перем. х1 х2 х3 х4 х5 вi Оцен. отн.
х1 1 -3/5   2/5 -1/5 1/5 1/5
х3   9/5   -1/5 3/5 2/5  
Оцен. строка   1/5   1/5 2/5 3/5  

 

Получено оптимальное решение:

х1 = 1/5, х2 =0, х3= 2/5

v = 1/(x1 + x2 + x3) = 5/3

q1 = 1/3, q2 = 0, q3 = 2/3

Вывод: чтобы обеспечить гарантированный средний проигрыш 5/3 игроку В нужно с вероятностью 1/3 выбрать первую стратегию и с вероятностью 2/3 – третью стратегию

(или так- чередовать стратегии 1 и 3 в соотношении 1:2).

Чтобы найти оптимальную стратегию игрока А вспомним раздел 6: (в оценочной строке последней таблицы находим абсолютные значения балансовых переменных х4, х5)

у1 = 1/5, у2= 2/5

р1 = (1/5)*(5/3)=1/3, р2 = 2/3.

Пример 2: (военная игра НАТО)

На маневрах флота в средиземном море сторона В может послать подводную лодку в один из регионов моря: 1 или 2. Другая сторона А имеет 3 противолодочных корабля и должна обнаружить и уничтожить подводную лодку.

Вероятность корабля потопить лодку в регионе 1 равна 0,6, а в регионе 2 - 0,4. Командованию флота нужно разработать стратегию распределения кораблей по регионам.

Данную конфликтную ситуацию рассмотрим как игру двух игроков А и В.

У игрока В две стратегии - послать лодку в регион 1 и в регион 2. У игрока А четыре стратегии (0,3), (1,2), (2,1) и (3,0).

Например, (2,1) означает посылку двух кораблей в 1 регион и одного - во 2 регион, и т.п.

Выигрыш игрока А – вероятность уничтожения лодки.

α=0,6, β=0,784

Поясним составление платежной матрицы.

(0,3)- посылка 0 кораблей в 1 регион и 3 кораблей во второй.

При этом в первом регионе имеется лодка - ясно, что вероятность ее уничтожения 0.

Пусть игрок В направил лодку во 2 регион:

вероятность того, что хотя бы один из 3-х кораблей уничтожит лодку: р = 1 – (1- 0,4)3 =0,784.

(2,1)- посылка 2 кораблей в 1 регион и одного корабля во 2 регион. Пусть игрок В направил лодку в 1 регион:

Р = 1- (1-0,6)2 = 0,64 и т.д. (просчитать вероятности самостоятельно).

Рассуждая, так же как и в первом примере:

Для игрока А:

0,6у2 + 0,84у3 + 0,936 у4 ≥ 1

0,784у1 + 0,64у2 + 0,4 у3 ≥ 1

F = у1 + у2 + у3 + у4 → min (1)

Для игрока В:

0,784х2 ≤ 1

0,6х1 + 0,64х2 ≤ 1

0,84х1 + 0,4х2 ≤ 1

0,936х1 ≤ 1

G= x1 + x2 → max (2)

Решим задачу (1) в EXCEL. (файл игра).

у1 =0, у2= 1,48, у3=0,13, у4=0, v= 1/(у12 + у3 + у4)= 1/1,61 = 0,62

р1=0, р2 =1,48*0,62= 0,92, р3=0,13*0,62= 0,08, р4 =0

Итак, оптимальная стратегия игрока А – послать 1 корабль в 1-й регион с вероятностью 0,92 и 2- в 1 регион с вероятностью 0,08. Не следует посылать 3 корабля во 2 -й регион и 3 корабля в 1 регион!

Пример 3.

Найти решение игры, заданной платежной матрицей:

Решаем игру сведением к двойственным задачам.

Для игрока А:

1 + 3у2 + 2 у3 ≥ 1

-2у1 + 5у2 + у3 ≥ 1

1 + у2 + 5у3 ≥ 1

G = у1 + у2 + у3 → min (1)

 

Для игрока В:

1 – 2х2 + 2х3 ≤ 1

1 + 5х2 + х3 ≤ 1

1 + х2 + 5х3 ≤ 1

F = х1 + х2 + х3 → max (2)

 

Решим задачу (1) в EXCEL:

у1 = 0,03 у2 = 0,19 у3= 0,15

v= 1/ (0,03 + 0,19 + 0,15)= 2,7

р1 = 0,03*2,7=0,081

р2 = 0,19*2,7 =0,513

р3 = 0,15*2,7 =0,405

 

Наиболее обещающей для игрока А является 2-я стратегия.

Решим задачу (2) в EXCEL:

х1 = 0,22 х2 = 0,05 х3= 0,1

v= 1/ (0,22 + 0,05 + 0,1)= 2,7

q1 = 0,22*2,7=0,594

q2 = 0,05*2,7 =0,135

q3 = 0,1*2,7 =0,27




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 522; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.043 сек.