Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Игры двух лиц с произвольной суммой

Лекция № 9. Бескоалиционные игры.

Цель: изучить особенности решения бескоалиционных игр.

Ключевые слова: бескоалиционная игра, решение бескоалиционной игры, чистая и смешанная стратегия, седловая точка.

Вопросы:

1. Игры двух лиц с произвольной суммой;

2. Пример.

 

Антагонистические игры, которые мы изучали ранее, описывают конфликты весьма частного вида. Более того, для большинства имеющих место в реальной жизни конфликтов антагонистические игры либо вовсе не могут считаться приемлемыми, адекватными описаниями, либо, в лучшем случае, могут рассматриваться как первые грубые приближения.

Во-первых, антагонистические игры никак не затрагивают своими описаниями конфликты с числом строк, большим, чем два. В месте с тем, такие многосторонние конфликты не только встречаются в действительности, но являются принципиально более сложными, чем конфликты с двумя участниками, и даже не поддаются сведению к последним.

Во-вторых, даже в конфликтах с двумя участниками интересы сторон вовсе не обязаны быть противоположными; во многих конфликтах такого рода случается так, что одна из ситуаций оказывается предпочтительнее другой для обоих участников.

В-третьих, даже если любые две ситуации сравниваются игроками по их предпочтительности противоположным образом, различие разностей в оценках этой предпочтительности оставляет место для соглашений, компромиссов и коопераций.

Наконец, в-четвёртых, содержательная острота конфликта не обязательно соответствует его формальной антагонистичности. Например, при встрече двух боевых единиц воюющих сторон (скажем, танков) обоюдное их стремление уничтожить друг друга не выражает антогонистичности конфликта: в антогонистическом конфликте цели сторон оказываются строго противоположными, и стремлению одной стороны уничтожить другую противоположным будет стремление избежать уничтожения.

В конечной бескоалиционной игре двух игроков (КБИДИ) каждый из них делает один ход  выбирает одну стратегию из имеющегося у него конечного числа стратегий, и после этого он получает свой выигрыш согласно определённым для каждого из них матрицами выигрышей. Другими словами КБИДИ полностью определяется двумя матрицами выигрышей для двух игроков. Поэтому такие игры называются биматричными. Пусть у игрока 1 имеется m стратегий, i =, у игрока 2 имеется n стратегий, j =. Выигрыши игроков 1 и 2 соответственно задаются матрицами

 

А = , В =

 

Будем по-прежнему считать полный набор вероятностей x = (x1,..., xm) применения 1 игроком своих чистых стратегий смешанной стратегией игрока 1, и у = (y1,..., yn)  смешанной стратегией игрока 2. тогда средние выигрыши игроков 1 и 2 соответственно равны

 

Ситуация равновесия для биматричной игры составляет пару (x,y) таких смешанных стратегий игроков 1 и 2, которые удовлетворяют неравенствам:

или

 

Для определения ситуаций равновесия необходимо решить систему неравенств (1) и (2) ( и ) относительно неизвестных x = (x1,..., xm) и у = (y1,..., yn) при условиях

, , xi ³ 0 (i =), yj ³ 0 (j =).

Теорема (Нэша). Каждая биматричная игра имеет по крайней мере одну ситуацию равновесия.

В качестве примера рассмотрим случай, когда каждый игрок имеет две чистые стратегии. В этом случае матрицы A и B равны:

A = , B = .

Смешанные стратегии для игроков 1 и 2 имеют вид:

(x, 1 x), (y, 1 y) 0 £ x £ 1; 0 £ y £ 1,

а средние выигрыши равны:

E1(A,x,y) = xA = (x; 1- x)=

= (a11  a12  a21 + a22) xy + (a12 - a22) x + (a21 - a22) y + a22.

E2(B,x,y) = xB = (x; 1- x)=

= (b11 - b12 - b21 + b22) xy + (b12 - b22) x + (b21 - b22) y + b22.

Условия и будут выглядеть

£ E1(A,x,y),

(x; 1- x) £ E2(B,x,y),

или

Преобразовав (3) и (4), получим

(1- x) y + (1- x) £ 0

(a11 - a12 - a21 + a22) xy + (a12 - a22) x ³ 0

или

Т. о., множество всех приемлемых стратегий для игрока 1 удовлетворяет условиям (5) и (6), 0 £ x £ 1; 0 £ y £ 1. Чтобы найти x рассмотрим 3 случая:

1. Если x = 0, то (6) справедливо " y, а (5) имеет вид:

a1y - a2 £ 0.

2. Если x = 1, то (5) справедливо " y, а (6) имеет вид:

a1y - a2 ³ 0.

3. Если 0 < x < 1, то (5) разделим на (1 - x), а (6)  на x и получим

Итак, множество К решений системы (5)  (6) состоит из

всех ситуаций вида (0; y), если a1y - a2 £ 0; 0 £ y £ 1;

всех ситуаций вида (x; y), если a1y - a2 = 0; 0 < x < 1;

всех ситуаций вида (1; y), если a1y - a2 ³ 0; 0 £ y £ 1.

 

Если a1 = a2 = 0, то решением является xÎ[0; 1], yÎ[0; 1], т. к. все неравенства (7)  (8) выполняются при всех x и y, т. е. множество приемлемых для игрока 1 ситуаций покрывает весь единичный квадрат.

Если a1 = 0, a2 ¹ 0, то выполняется либо (7), либо (8), и поэтому решением является либо x = 0, либо x=1 при 0 £ y £ 1 (приемлемой стратегии в игре не существует).

Если a1 > 0, то из (7) получаем решение

x = 0; y £ := a,

Из (8) следует ещё решение x = 1, y ³ a, из (9) следует ещё решение

0 < x < 1, y = a.

Если a1 < 0, то решение следующее:

x = 0, y ³ a; x = 1, y £ a; 0 < x < 1, y = a.

 

При этом необходимо учитывать, что дополнительно должно быть

0 £ y £ 1.

Геометрически это выглядит следующим образом:

 

 

y ¥ y ¥ y ¥

 

1 1 1

a1>0 a1>0 a1>0

a<0 a=0 1< a<1

(x, a)

 

0 1 x 0 1 x 0 1 x

 

 

 ¥  ¥  ¥

 

y ¥ y y

¥ ¥

 

1 a1>0 1 a1>0 1 a1< 0

(x, 1) a=1 a >1 (x, a) 0< a<1

(0, b)

 

x x x

0  ¥ 1 0  ¥ 1 0  ¥ 1

 

 

Для игрока 2 исследования аналогичны. Если ввести обозначения

b1:= b11 - b12 - b21 + b22

b2:= b22 -

то множество L приемлемых для него ситуаций состоит из:

всех ситуаций вида (x, 0), если b1x - b2 < 0; 0 £ x £ 1,

всех ситуаций вида (x, y), если b1x - b2 = 0; 0 £ x £ 1; 0 < y < 1,

всех ситуаций вида (x, 1), если b1x - b2 > 0; 0 £ x £ 1.

Результаты следующие:

если b1 = b2 = 0, то решение 0 £ x £ 1; 0 £ y £ 1;

если b1 = 0; b2 ¹ 0, то решение либо y = 0, либо y = 1 при 0 £ x £ 1 (приемлемой стратегии в игре не существует);

если b1 > 0, то решения следующие:

y = 0, x < = b; y = 1, x > b; 0 < y < 1; x = b;

если b1 < 0, то решения следующие:

y = 0, x > b; y = 1, x < b; 0 < y < 1; x = b

При этом необходимо учитывать, что 0 £ x £ 1.

 

y y

 

 

1 1

 

(b,y) (b,y)

 

x x

0 1 0 1

b1 > 0 b1 < 0

0 < b < 1 0 < b < 1

Решением игры является пересечение множеств K и L, т.е. те значения x и y, которые являются общими для множеств K и L.

y y

1 1

 

x x

 

0 1 0 1

а) б)

При этом зигзаги K и L могут быть не только одинаковой, но и противоположной направленности. В первом случае зигзаги имеют одну точку пересечения, а во-втором ­­­ три. Средние выигрыши при этом определяются по формулам (*), если в них подставить полученное решение x и y (рис.а)). Очевидно a входит в смешанную стратегию игрока 2, хотя зависит только от выигрышей 1 игрока; b входит в смешанную стратегию игрока 1, хотя зависит только от выигрышей игрока 2. Сравнение этих результатов с результатами решения матричных игр с нулевой суммой показывает, что a совпадает с оптимальной стратегией игрока 1 в матричной игре с матрицей A, а b  с оптимальной стратегией игрока 2 в матричной игре с матрицей B. Отсюда можно сделать вывод, что равновесная ситуация направляет поведение игроков не только на максимизацию своего выигрыша, сколько на минимизацию выигрыша противника.

С другой стороны, естественно также рассматривать подходящим поведение игроков в конечных бескоалиционных играх, направленное на максимизацию своего выигрыша с учётом максимального противодействия игрока, т.е. подходящей стратегией игрока 1 считать оптимальную смешанную стратегию игрока 1 в матричной игре с матрицей A, а подходящей стратегией игрока 2 считать оптимальную смешанную стратегию игрока 2 в матричной игре с матрицей B, если в ней рассматривать решение с позиций максимизации выигрыша игрока 2, т.е. решать её, как для игрока 1, с матрицей .

 

<== предыдущая лекция | следующая лекция ==>
Аксиомы Шепли | Пример. Министерство желает построить один из двух объектов на территории города
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 649; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.