Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

И сотрудничества




Матричная игра как модель конкуренции

Пусть игроки – Первый и Второй, играют в матричную игру с матрицей . Пусть стратегия Первого есть Р = (p1, p2, …, pm), где pi – вероятность выбора i-ой строки, а Второго – Q = (q1, q2, …, qn), где qj – вероятность выбора j-го столбца. Тогда выигрыш Первого есть случайная величина (с.в.) с рядом распределения:

W(P,Q)        
         

 

Математическое ожидание этой с.в., т.е. есть средний выигрыш Первого. Пусть есть дисперсия этой с.в. Естественно назвать среднее квадратическое отклонение с.в. , т.е. риском для Первого при игре со стратегиями . Поскольку выигрыш Первого есть проигрыш для Второго, то есть случайный проигрыш Второго и r вполне естественно можно назвать риском игры с такими стратегиями и для Второго.

Предположим сначала, что игроки озабочены только максимизацией среднего дохода за партию игры – обычная цель в таких играх. Тогда игроки будут играть со своими оптимальными стратегиями: – Первый игрок и – Второй.

Математическое ожидание с. в. называется ценой игры, обозначим ее .

Но что же можно назвать риском всей игры?

Вычислим дисперсию выигрыша Первого при оптимальных стратегиях игроков.

.

Так как , а через обозначена сумма .

Заметим, что в сумме можно оставить лишь те слагаемые, у которых

Заметим теперь, что если Первый играет со стратегией , а Второй отвечает -й чистой стратегией , где единица находится на j-ом месте, то выигрыш первого есть с.в. с рядом распределения:

       
         

 

Если есть оптимальная стратегия Первого, а , то из теории матричных игр с нулевой суммой известно, что выигрыш Первого при стратегиях Р* и по-прежнему равен цене игры , а дисперсия выигрыша Первого при этом равна , то есть равна . Таким образом, что происходит с риском выигрыша Первого, можно понять, сравнив дисперсию при оптимальных стратегиях и дисперсию или величины и . Пусть Как легко понять, если среди есть разные числа, то

Теперь можно сделать следующий вывод:

Чуть-чуть отойдя от своей оптимальной стратегии (смотрите ниже Пример 1) и таким образом почти не уменьшив свой выигрыш, Первый может значительно уменьшить свой риск. При этом уменьшается и риск Второго, что отвечает и его интересам.

Чисто математически можно сказать, что в описанной ситуации риск выигрыша Первого не зависит от его стратегии непрерывно.

Рассмотрим подробно пример матричной игры с матрицей . Как известно, общий случай в окрестности оптимальных стратегий игроков сводится к анализу такой игры.

Пример 1. Пусть матрица игры есть . Графическое решение этой игры найдем, решив следующую задачу:

Z = →max; → max;

-2р1 + 2р2, -4р1 - ≥ -2,

р1, или подставляя вместо , получаем: р1 - ≥ 0,

р1 + р2 = 1, р1 - ≥ 0,

р1,2 ≥ 0, 0 ≤ р1 ≤1.

Графическое решение последней задачи показано на следующем рисунке 1:

 

Оптимальным решением задачи будет т. А (2/5, 2/5). Поэтому цена игры ν0 = 2/5 и P* = (2/5, 3/5). Стратегию Q* = (q1*, q2*) найдем, решив следующую СЛАУ:

-2 q1* + q2* = 2/5 Откуда: Q* = (1/5, 4/5)

2 q1* = 2/5.

Отметим, что так как матрица игры не имеет седловой точки, то решение можно найти по следующим формулам:

 

= ,

 

= ,

 

= ,

 

= ,

 

= .

 

Дисперсия выигрыша Первого при оптимальных стратегиях , т. е. риск игры равен примерно 1. Далее вычисления дают , ; , Примерная, но достаточно точная зависимость риска Первого в малой окрестности его оптимальной стратегии показана на рис. 2.

 

 

 

 


Как видно из рис. 2 при отходе Первого от своей оптимальной стратегии вправо, т. е. при увеличении вероятности выбора им 1-й строки. Второй начинает отвечать 1-й чистой стратегией и риск Первого скачком увеличивается до , а при отходе Первого от своей оптимальной стратегии влево Второй переходит на свою 2-ю чистую стратегию и риск Первого скачком снижается до

 

 

q1
1/5

Рис. 3

 

 

Аналогичное верно и в отношении Второго. Кратко повторим. Примерная, но достаточно точная зависимость риска Второго в малой окрестности его оптимальной стратегии показана на рис. 3. Как видно из рис. 3, при отходе Второго от своей оптимальной стратегии вправо, т. е. при увеличении вероятности выбора им 1-й строки, Первый начинает отвечать 2-й чистой стратегией, и риск Второго скачком уменьшается до , а при отходе Второго от своей оптимальной стратегии влево, Первый переходит на свою 1-ю чистую стратегию, и риск Второго скачком увеличивается до

Пусть . Эту величину и можно назвать риском всей игры. Однако играть с таким риском можно лишь при согласии обеих сторон. Для анализируемой игры и игроки для достижения такого риска должны играть так: Первый играет со своей оптимальной стратегией 3/5), а Второй должен использовать 2-ю чистую стратегию.

Пример 2. Рассмотрим пример игры с платежной матрицей размера 4x5:

    -3     -5
A4,5=(аij)4,5 = -3   -3 -5  
  -5 -3 -5   -6
    -5     -7

Вначале проведет анализ на доминирование. i-я строка доминирует j-ю, если все элементы i-й строки больше или равны соответствующих элементов j-й. Так как строки выбирает Первый игрок, то мы исключаем из платежной матрицы доминируемые строки. В нашем примере 1-я строка доминирует 3-ю. В результате исключения 3-й строки получим

    -3     -5
A`3,5=(аij)3,5 = -3   -3 -5  
    -5     -7

 

Третий столбик доминирует первый и, так как столбцы выбирает Второй игрок, то мы исключаем доминирующий третий столбец. В результате получим платежную матрицу 3´4, которую упростить уже невозможно.

      ai
    -3   -5 -5
A``3,4 = -3   -5   -5
        -7 -7
bj          

 

Далее приведем анализ игры на седловую точку. Находим минимумы по строкам ai. Тогда нижняя цена игры

a= -5.

Найдем максимумы по столбцам bj. Тогда верхняя цена игры

b=4.

Поскольку a¹b, то решения игры в чистых стратегиях нет. Будем искать решение в смешанных стратегиях. Предварительно прибавим к каждому элементу платежной матрицы константу, равную 7, сделав их неотрицательными. Решение игры при этом не изменится, а цена игры возрастет на 7 и будет больше нуля.

Матрица игры примет следующий вид:

         
         
    9        
  A’’3,4+7=        
           

 

В силу теоремы Неймана решение игры сводится к нахождению решений симметричной пары взаимно двойственных задач линейного программирования. Пусть P=(p1;p2;p3); Q=(q1;q2;q3;q4)- стратегии игроков. Найдем сначала Q*

Если Второй игрок применяет свою оптимальную стратегию, то Первый игрок не может улучшить свое положение, отступая от своей оптимальной стратегии. Заставим Первого игрока отступать от своей оптимальной стратегии, пользуясь чистыми стратегиямиp1, p2, p3 (а Второй игрок, между тем, придерживается своей оптимальной стратегии Q*). В любом случае проигрыш Второго игрока будет не больше, чем цена игры

9q1 + 4q2 + 11q3 + 2q4 £ ,

4q1 + 11q2 + 2q3 + 13q4 £ ,

11q1 + 2q2 + 13q3 £ .

 

Разделим каждое из неравенств на > 0 и введем обозначения

 

qj  
= xj ³0 (j=1,4).

 

Получим

9x1 + 4x2 + 11x3 + 2x4 £ 1,

4x1 + 11x2 + 2x3 + 13x4 £ 1,

11x1 + 2x2 + 13x3 £ 1.

 

Поскольку å qj=1, то переменные x1,x2,x3,x4 удовлетворяют условию

j=1

x1 + x2 + x3 + x4 = .

 

Но есть проигрыш второго игрока, который он стремится сделать минимальным. Следовательно, величина 1/ должна быть максимальна. Таким образом, имеем следующую задачу линейного программирования.

Найти вектор x=(x1,x2,x3,x4), который обеспечивает максимум целевой функции

Z =x1+x2+x3+x4®max,

при следующих линейных ограничениях:

9x1 + 4x2 + 11x3 + 2x4 £ 1,

4x1 + 11x2 + 2x3 + 13x4 £ 1, (1)

11x1 + 2x2 + 13x3 £ 1,

x1,x2,x3,x4 ³0.

 

После приведенной задачи к основной задаче линейного программирования найдем ее оптимальное решение симплексным методом:

X*=(0; 1/28; 1/14; 1/28), при значении целевой функции Zmax=1/7.

Цену игры и Q* найдем по следующей формуле:

= 1/Z max = 7; Q* = *X* = (0, ¼, ½, ¼).

В качестве проверки, студент может решить эту задачу с использованием компьютера (см. приложение 12).

Найдем теперь оптимальную стратегию P* первого игрока. Если Первый игрок применяет свою оптимальную стратегию, то Второй игрок не может улучшить свое положение, отступая от своей оптимальной стратегии. В случае использования Вторым игроком своих чистых стратегий, а Первым игроком своей оптимальной стратегии, выигрыш Первого будет не меньше, чем цена игры:

9p1 + 4p2 + 11p3 ³ ,

4p1 + 11p2 + 2p3 ³ ,

11p1 + 2p2 + 13p3 ³ ,

2p1 + 13p2 ³ .

Разделим каждое из неравенств на > 0 и введем обозначения:

pi

=yi ³ 0 (i=1,3).

 

Получим:

9y1 + 4y2 + 11y3 ³ 1,

4y1 + 11y2 + 2y3 ³ 1,

11y1 + 2y2 + 13y3 ³ 1,

2y1 + 13y2 ³ 1.

Поскольку å pi=1, то переменные y1,y2 ,y3 удовлетворяют условию

i=1

 

y1+y2 +y3 = 1/ .

Но есть выигрыш Первого игрока, который стремится его максимизировать. Следовательно, величина 1/ должна быть минимальна. Таким образом имеем следующую задачу линейного программирования.

Найти вектор y=(y1,y2 ,y3), который обеспечивает минимум целевой функции:

L= y1+y2 +y3®min.

При следующих линейных ограничениях:

9y1 + 4y2 + 11y3 ³ 1,

4y1+ 11y2 + 2y3 ³ 1, (2)

11y1 + 2y2 + 13y3 ³ 1,

2y1 +13y2 ³ 1,

y1,y2 ,y3³ 0.

Эта задача является двойственной по отношению к рассмотренной выше задаче (1). Решение задачи (2) возьмем из последней симплексной таблицы при решении задачи (1):

Уопт = (1/28, 1/14 1/28); Lmin = Zmax = 1/7.

Откуда цена игры u0 по-прежнему равна 7.

Далее, найдем P* = 0*yопт = (1/4, 1/2, 1/4).

Отметим, что решение задачи (2) можно также найти с помощью второй основной теоремы двойственности.

Возвращаемся теперь к исходной матрице игры A4,5 . Решение этой игры имеет вид:

=0; P* = (1/4, 1/2, 0, 1/4); Q* = (0, 1/4, 0, 1/2, 1/4,).

Найдем риск игры при использовании игроками своих оптимальных стратегий

 

 

r0 = аij2 pi* qj* - = √ 26,

 

 

а также риск при использовании одним из игроков своей чистой, а другим – своей оптимальной стратегии (нижний индекс Первого игрока, верхний – Второго игрока):

D(p*) (Q2)= å ai22 pi* - =(-3)2´1/4 + 42´1/2+(-5)2´1/4- 02 = 33/2; r(0)(2) = √33/2,

i=1

 

D(p*) (Q4)= å ai32 pi* - = (4)2´1/4 + (-5)2´1/2+62´1/4- 02 = 51/2; r(0)(2) = √51/2,

i=1

 

D(p*) (Q5)= å ai42 pi* - = (-5)2´1/4 + 62´1/2+(-7)2´1/4- 02 = 73/2; r(0)(4)= √73/2,

i=1

 

D(p1) (Q*)= åa1j2 qj*- = 22´0+(-3)2´1/4+42´1/2+(-5)2´1/4- 02=33/2; r(1)(0)=√33/2,

j=1


D(p2) (Q*)= åa2j2 qj*- =(-3)2´0+42´1/4+(-5)2´1/2+62´1/4- 02=51/2; r(2)(0)= √51/2,

j=1

 

D(p4) (Q*)= åa3j2 qj*- =42´0+(-5)2´1/4+62´1/2+(-7)2´1/4- 02=73/2; r(3)(0)= √73/2.

j=1

 

Минимальное значение риска равно √33/2, и меньше r0. Этот риск соответствует ситуациям, когда Первый игрок играет по оптимальной стратегии, а Второй игрок использует вторую чистую стратегию Q2; или, когда Первый игрок использует свою первую чистую стратегию P1, а Второй игрок – оптимальную Q*. Однако играть с таким риском, как отмечалось выше, можно только с согласия обеих игроков, то есть при их сотрудничестве друг с другом.

 

 




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 408; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.092 сек.