Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Тема 7.1. Антагонистические игры




Простейшим видом игры является игра двух лиц с нулевой суммой (сумма выигрыша сторон равна нулю, т. е. выигрыш одного равен проигрышу другого).

Пусть игрок А выбирает одну из стратегий Аi (i = 1, 2,¼, m), а игрок В выбирает одну из стратегий Вj (j = 1, 2, ¼, n), причем каждый выбор делается при полном незнании выбора другого игрока. Выигрыш игрока А будет некоторой функцией j(Аij),зависящей от выбранных стратегий. Пусть j(Аij) = hij. Составим матрицу выигрышей:

 

 

Сделать ход для игрока А означает выбрать одну из строк, а для игрока В - выбрать один из столбцов матрицы H.

Выбрав i - ю строку, игрок А при самом хорошем ходе игрока В получит выигрыш, равный величине min hij. Значит, стратегия

для игрока А будет оптимальной, если он будет делать ходы так, чтобы получить выигрыш не менее величины a = (hij). Величина a называется нижней ценой игры. Игрок В, выбрав

j - й столбец, при самом хорошем ходе игрока А допускает проигрыш, равный величине max hij. Стратегия игрока В будет оптимальной, если он будет делать ходы так, чтобы проиграть не более величины b = hij). Величина b называется верхней ценой игры. Выигрыш V удовлетворяет неравенству a£V£b, если игроки применяют оптимальные стратегии. Рассмотренные оптимальные стратегии игроков А и В называются соответственно максиминной и минимаксной.

Если a = b, то игра называется вполне определенной. В этом случае V = hij, где hij - элемент матрицы H, который является одновременно минимальным в строке i и максимальным в столбце j (он называется седловой точкой матрицы).

Решить матричную игру - значит найти оптимальные стратегии игроков и цену игры.

Пример. Решить игру, заданную матрицей:

H =

Решение. Так как матрица H имеет седловую точку h12=3, то цена игры равна 3, при этом игрок А должен выбрать первую строку, а игрок В должен выбрать второй столбец. Отклонение от указанной стратегии приводит к уменьшению выигрыша игрока А или увеличению проигрыша игрока В.

Теперь рассмотрим случай отсутствия седловой точки в матрице выигрышей H. В этом случае a < b. Применение максиминной и минимаксной стратегий обеспечивает выигрыш одного не менее величины a и проигрыш другого не более величины b.

Для каждого игрока естественен вопрос увеличения выигрыша (уменьшения проигрыша). Поэтому игроки применяют

не одну, а несколько стратегий. Например, выбор стратегий (строк, столбцов) можно осуществлять случайным образом, определив вероятность выбора каждой строки и каждого столбца.

Пусть i - я строка выбирается игроком А с вероятностью хi (i = 1, 2, ¼, m), а j - й столбец выбирается игроком В с вероятностью yj (j = 1, 2, ¼, n). Так как одна из строк и один из столбцов будут обязательно выбраны (каждый игрок обязан сделать ход), то

Цена игры V определяется как математическое ожидание величины, т.е.

V =

Если игрок А выбрал оптимальную стратегию (т.е. наилучшим образом каждой строке поставил в соответствие вероятность ее выбора), то его выигрыш должен быть не меньше цены игры, т.е.

V £

Аналогично применение игроком В оптимальной стратегии должно обеспечить ему проигрыш, не превышающий цену игры, т.е.

V ³

Покажем, что решение матричной игры в рассматриваемом случае можно свести к решению задачи линейного программирования.

Если игрок А применяет оптимальную стратегию

Х = (х1, х2, ¼, хn), то выполняются неравенства:

х1h11 + x2h21 + ¼+xm hm1³ V,

x1h12 + x2h22 +¼ + xm hm2 ³ V,

.......................

x1h1n + x2h2n + ¼ + xm hmn³ V.

Каждое из неравенств почленно поделим на V (V> 0), получим систему:

t1h11 + t2 h21 + ¼ + tmhm1 ³ 1,

t1h12 + t2h22 + ¼ + tmhm2 ³ 1,

.......................

t1h1n + t2h2n + ¼ + tmhmn ³ 1,

где ti = xi / V (i = 1, 2, ¼, m), при этом

Решение игры требует для игрока максимизировать величину V, значит необходимо минимизировать величину f =.

Таким образом, пришли к задаче линейного программирования, в которой требуется минимизировать линейную функцию f =при условии, что величины ti неотрицательные и удовлетворяют системе линейных неравенств.

Если игрок В применяет оптимальную стратегию

У = (у1, у2, ¼, уn), то выполняются неравенства:

y1h11 + y2h12 + ¼ + ynh1n £ V,

y1h21 + y2h22 + ¼ + ynh2n £ V,

.......................

y1hm1 + y2hm2 + ¼ + ynhmn £ V.

Каждое из неравенств почленно поделим на V (V> 0), получим систему:

u1h11 + u2h12 + ¼ + unh1n £ 1,

u1h21 + u2h22 + ¼ + unh2n £ 1,

.......................

u1hm1 + u2hm2 + ¼ + unhmn £ 1,

где uj = при этом

Решение игры требует для игрока В минимизировать величину V, значит необходимо максимизировать величину L = .

Таким образом, снова пришли к задаче линейного программирования (она является двойственной для первой), в которой требуется максимизировать линейную функцию L = при условии, что переменные величины uj неотрицательные и удовлетворяют системе линейных неравенств.

Пример. Решить игру, заданную матрицей:

H = .

Решение. Находим нижнюю и верхнюю цены игры:

a = ,

b =

Так как a ¹ b, то матрица не имеет седловой точки. Пусть j - тый столбец выбирается с вероятностью уj (j = 1, 2, 3). Тогда имеем систему неравенств:

Поделив каждое неравенство системы на V и обозначив уj / V через uj, приходим к системе неравенств:

для которой L = u1 + u2 + u3 = . Надо найти такое решение

системы, для которого L принимает наибольшее значение. Решение находим симплексным методом с помощью таблиц:

 

Таблица 7.1 Таблица 7.2

  u1 u2 u3       u4 u2 u3  
u4           u1 1/4 3/4 2/4 1/4
u5           u5 -3/4 -5/4 6/4 1/4
  -1 -1 -1       1/4 -1/4 -2/4 1/4

 

Таблица 7.3 Таблица 7.4

  u4 u2 u5       u4 u1 u5  
u1 3/6 7/6 -2/6 1/6   u2 3/7 6/7 -2/7 1/7
u3 -3/6 -5/6 4/6 1/6   u3   5/7   2/7
    -4/6 2/6 2/6     2/7 4/7 1/7 3/7

Из последней таблицы видим, что u1 = 0, u2 = u3 =

Lmax =

Значит,

Таким образом, цена игры и оптимальная стратегия игрока В найдена.

Пусть i - тая строка выбирается с вероятностью хi (i = 1, 2). Тогда имеем систему неравенств:

 

Поделив каждое из неравенств на V и обозначив хi / V через ti, приходим к системе неравенств:

 

для которой f = t1 + t2 = Пользуясь соответствием:u4 «t1,

u5 «t2, из последней строки таблицы 7.4 находим значение t1 и t2, при которых f принимает наименьшее значение. Таким образом,

t1 =

Ответ: Цена игры равна 7/3. Чтобы средний выигрыш игрока А был не меньше7/3, он должен выбирать первую строку с вероятностью 2/3 а вторую строку - с вероятностью 1/3 Чтобы средний проигрыш игрока В был не более7/3, он должен выбирать первый столбец с вероятностью 0, второй - с вероятностью 1/3 третий - с вероятностью 2/3.

Пример. Предприниматель с целью получения прибыли решил свободные средства вложить в акции трех акционерных обществ: “Альфа”, “Бета”, “Гамма”. В условиях нестабильной экономики, когда доходность зависит от степени риска, неплатежа, ликвидности, налогообложения, инфляционных ожиданий

и т.д. он обратился к экономистам, которые дали прогноз доходности в зависимости от трех рыночных ситуаций в стране:

 

Таблица 7.5

стратегия рынка стра тегия предпри- нимателя   I   II   III  
  Вложения в АО “Альфа” 5% 4%   3%  
  Вложения в АО ”Бета” 3% 2% 4%  
  Вложения в АО “Гамма” 4% 5% 3%  

 

Найти оптимальную стратегию предпринимателя, которая обеспечила бы ему наибольшую прибыль.




Поделиться с друзьями:


Дата добавления: 2014-10-31; Просмотров: 286; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.024 сек.