Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Решение игры в смешанных стратегиях




Теорема 3. Для того чтобы смешанные стратегии и были оптимальными в игре с матрицей (7.1) и ценой игры u, необходимо и достаточно, чтобы выполнялись следующие неравенства:

³ u; j = , причем = 1; (7.3)

£ u; i = , причем = 1. (7.4)

 

Нахождение оптимальной стратегии можно свести к решению задачи линейного программирования.

Пусть требуется найти оптимальные стратегии для игры с заданной платежной матрицей (7.1), для которой aij строго больше нуля (аij >0, i= ,j = ), тогда цена игры u > 0. Найдем оптимальную стратегию игрока А – ().

Разделим левую и правую части в выражении (7.3) на положительную величину u:

³ 1; = .

Введем обозначение = Хi, тогда

Хi ³ 1; j = ; = .

Поскольку игрок А стремится сделать свой гарантированный выигрыш (u) как можно большим (u ® max), то величина должна быть как можно меньше (u ® min), тогда имеем следующую задачу линейного программирования:

f(x) = ® min, (7.5)

Хi ³ 1; j = , (7.6)

Хi ³ 0; i = . (7.7)

 

Если Х* = (, ,… ) – оптимальный план задачи (7.5) – (7.7), а минимум функции f(x) = f(x*) = f*, то цена игры u при этом составит u = , а т.к. = Хi, тогда = (u × ,… u × ) = (,… ) – оптимальная смешанная стратегия игрока А.

Для игрока В используя выражение (7.4), получим

g(y) = ® max.

yj £ 1, i = .

yj ³ 0; j = .

Решение игры u = ;

= (u × ,… u × ) = (,… ).

 

Пример. Найти оптимальные смешанные стратегии игры, заданной следующей платежной матрицей:

 

  В1 В2 В3 нижняя цена игры a = 4, верхняя цена игры b = 5, т.е. a ¹ b – седловой точки нет.
А1      
А2      

 

Сведем данную задачу к задаче линейного программирования.

Найдем оптимальную стратегию игрока А – ():

f(x) = X1 + X2 ® min.

 

X1 + 8X2 ³ 1,

10X1 + 4X2 ³ 1,

3X1 + 5X2 ³ 1,

 

X1, X2 ³ 0.

 

f(x) = 0,21; X1 = 0,026; X2 = 0,184,

отсюда

u = = 4,76; P1 = 4,76 × 0,026 = 0,124;

P2 = 4,76 × 0,184 = 0,876.

Найдем оптимальную стратегию игрока В – ():

g(y) = y1 + y2 + y3 ® max.

y1 + 10y2 + 3y3 £ 1,

8y1 + 4y2 + 5y3 £ 1,

y1, y2 , y3 ³ 0.

 

g(y) = 0,21; y1 = 0; y2 = 0,0526; y3 = 0,158,

 

отсюда

q1 = 0; q2 = 4,76 × 0,0526 = 0,25;

q3 = 4,76 × 0,158 = 0,75.

 

Таким образом, применяя свою первую чистую стратегию с вероятностью 0,124 и вторую – с вероятностью 0,876, игрок А выигрывает величину 4,76. Игрок В, применяя свою вторую чистую стратегию с вероятностью 0,25 и третью – с вероятностью 0,75, проигрывает величину 4,76, иначе он проигрывает больше.

 

Игра два на два (2 х 2)

Рассмотрим игру, в которой у игроков А и В по две стратегии. Платежная матрица имеет вид

 

  В1 В2   (7.8)
А1 a11 a12
А2 a21 a22

Рассмотрим случай, когда игра не имеет седловой точки.

Теорема 4. Пусть и – оптимальные смешанные стратегии игры с платежной матрицей (7.1) и ценой игры u, тогда для любого i, при котором выполняется строгое неравенство

qj < u,

имеет место равенство pi = 0. А если pi > 0, то

qj = u.

Аналогично, если для некоторых j

× pi > u,

то для этих j qj = 0. А если qj > 0, то

× pi = u.

Определим оптимальную смешанную стратегию игрока А, а для этого решим систему трех уравнений с тремя неизвестными

а11 × p1 + а21 × p2 = u,

а12 × p1 + а22 × p2 = u,

p1 + p2 = 1.

Решив следующую систему, найдем оптимальную стратегию игрока В:

а11 × q1 + а12 × q2 = u,

а21 × q1 + а22 × q2 = u,

q1 + q2 = 1.

 

Рассмотрим первую систему. Вычитая из первого равенства второе, получая

11 - а12) × p1 + (а21 - а22) × p2 = 0.

 

Подставим P2 = 1 – P1, тогда

11 – а12) × p1 + (а21 – а22) (1– p1 ) = 0,

отсюда оптимальная смешанная стратегия для игрока А – S*(p1, p2)

это – хорошо

P1 = (а22 – а21)/(а11 – а12 + а22 – а21),

P2 = 1– P1 = (а11 – а12)/(а11 – а12 + а22 – а21).

цена игры

u = (а11 × а22 – а21 × а12)/(а11 – а12 + а22 – а21).

Рассуждая аналогично, для определения оптимальной стратегии игрока В получая

q1 = (а22 – а12)/(а11 – а12 + а22 – а21),

q2 = (а11 – а21)/(а11 – а12 + а22 – а21).

Пример. Имеются две конкурирующие фирмы А и В, выпускающие изделия двух модификаций. Изучение спроса покупателей показало, что если выпускаются изделия первой модификации обеими фирмами, А1 и В1, то 40 % покупателей предпочитают изделия фирмы А и 60 % - фирмы В. Если выпускаются изделия А1 и В2, то 90 % покупателей приобретают изделия А. Если изготавливаются изделия А2 и В1, будет продано 70 % изделий фирмы А. Наконец, если выпускаются изделия второй модификации А2 и В2 обеими фирмами, то 20 % покупателей предпочитают изделия фирмы А.

Решение. Представим выигрыш фирмы А в табличной форме

а11 = 40 % - 60 % = -20 %; а12 = 90 % - 10 % = 80 %;

а21 = 70 % - 30 % = 40 %; а22 = 20 % - 80 % = -60 %.

 

В1 В2 ai
А1 -20   -20
А2   -60 -60
bj      

Нижняя цена игры составляет (-20), верхняя равна 40. Игра не имеет седловой точки. Найдем оптимальные смешанные стратегии

p1 = (-60 - 40)/(-20 –80-60-40) = ; p2 = ;

u = [-20 × (-60)- 40 × 80]/ (-20 –80-60-40) = 10;

q1 = (-60 - 80)/(-20 –80-60-40) = ; q2 = .

Выигрыш фирмы А в соответствии с ценой игры составит 10 %. Следовательно, предпочтение покупателей можно выразить как А – В = 10 %, но А + В = 100 %, тогда А = 55 %; В = 45 %. Следовательно, при таких оптимальных стратегиях изделия фирмы А будут покупать 55 % потребителей, а фирма В – 45 % потребителей.

 




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 446; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.031 сек.