Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Методы решения матричных игр

Преобразование матричных игр.

Стратегия Аi называется доминирующей над стратегией Ak, если в строке Ai стоят выигрыши не меньшие, чем в соответствующих клетках Ak и из них по крайней мере один действительно больше, чем в соответствующей клетке строки Ak. Если же все выигрыши строки Ai равны соответствующим выигрышам строки Ak, то стратегия называется дублирующей. Аналогично для стратегий игрока В: доминирующей называется та его стратегия, при которой везде стоят выигрыши не большие, чем в соответствующих клетках другой, и по крайне мере один из них действительно меньше; дублирование означает полное повторение одного столбца другим. Все дублирующие стратегии и те, для которых есть доминирующие, можно отбросить.

ПРИМЕР 5.2.

  В1 В2 В3 В4 В5
A1 4 7 2 3 4
A2 3 5 6 8 9
А3 4 4 2 2 8
A4 3 6 1 2 4
A5 3 5 6 8 9

A5 дублирует A2, A1 доминирует над A4. Отбросив A5 и A4, получим

  В1 В2 В3 В4 В5
A1 4 7 2 3 4
A2 3 5 6 8 9
А3 4 4 2 2 8

В3 доминирует над В4 и В5 (В стремится отдать поменьше), а В1 над В2

  В1 В3
A1 4 2
A2 3 6
А3 4 2

Удалим дублирующую строку А3

  В1 В3
A1 4 2
A2 3 6

Упрощая матрицу игры, можно прийти к играм 2Ä2, 2Än, mÄ2, которые допускают геометрическую интерпретацию, что упрощает поиск оптимальной стратегии.

 

Сведение к задаче линейного программирования. Пусть имеется игра mÄn без седловой точки c выигрышами aij >0 (это всегда можно сделать, прибавляя ко всем членам матрицы достаточно большое число, от чего цена игры увеличится, но решение не изменится). Пусть цена игры – v (v>0, т.к. матрица игры положительна)

Требуется найти решение игры, т.е. две оптимальные смешанные стратегии.

SA=(p1, p2, …, pm), SB=(q1, q2, …qn), дающие каждой стороне максимально возможный для неё выигрыш (минимальный проигрыш)

Предположим, что мы применяем свою оптимальную стратегию, а игрок В отступает от своей оптимальной смешанной стратегии и пользуется чистыми стратегиями В1, В2, … Вn. Тогда наш выигрыш не может быть меньше, чем v. Можно составить систему неравенств:

a11 p1 + a21 p2 + …+ am1 pm ³ v

a1n p1 + a2n p2 + …+ am n pm ³ v

Разделим неравенства на v и обозначим x1 =p1 / v, … xm =pm / v

Тогда условия примут вид

a11 х1 + a21 х2 + …+ am1 хm ³ 1

a1n х1 + a2n х2 + …+ am n хm ³ 1

где хi – неотрицательные переменные.

Т.к. p1 +p2 +…,+pm=1, то х12 +…+хm=1/v

v – наш гарантированный выигрыш и мы хотим сделать его максимальным. Получили задачу линейного программирования: найти хi³0, удовлетворяющие системе неравенств и обращающие в минимум линейную функцию L = х1 + х2 + …+ хm. Следовательно, все методы линейного программирования можно использовать для нахождения оптимального решения игры. И наоборот, методы решения игры, можно применить для решения задач линейного программирования.

Метод итераций – один из самых простых численных методов решения игр (приближённый метод). Идея метода: разыгрывается «мысленный эксперимент», в котором А и В поочерёдно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Игрок А выбирает произвольно одну из своих стратегий Ai. Противник отвечает ему той из своих стратегий Bj, которая хуже всего для А при стратегии Ai. Далее А выбирает ту стратегию Ak, которая даёт ему максимальный выигрыш при стратегии Bj. Теперь противник отвечает той стратегией, которая является наихудшей для нашей смешанной стратегии (Ai, Ak), в которой до сих пор применённые стратегии встречаются с равными вероятностями=1/2. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все применённые ранее стратегии входят пропорционально частотам их применения. Такой метод сходится: при увеличении числа партий средний выигрыш на 1 партию будет стремиться к цене игры, а частоты применения стратегий – к вероятностям в оптимальных смешанных стратегиях.

ПРИМЕР 5.3.

Рассмотрим задачу «про пальцы». Увеличим на 5 все элементы матрицы. Цена игры также увеличится на 5.

  В1 В2 В3
A1 7 2 9
A2 2 9 0
А3 9 0 11

Проведем мысленный эксперимент:

k i В1 В2 В3 J A1 A2 А3 v v*
    9 11 13 15 22 31 0 9 18 27 29 29 11 11 11 11 20 31         4.5 3.67 2.75 4.0 4.84 5.5 6.6 5.5 4.5 6.75 4.84 4.13 5.3 5.17 4.79 5.3 4.78 5.1 4.87 5.2 4.84 5.07 4.9

v – нижняя оценка игры, равная минимальному накопленному выигрышу, делённому на число партий. Аналогично – верхняя оценка. v* среднееарифметическое между оценками.

v*»5, p1*=4/15»0.266, p2*=7/15»0.468, p3*=4/15»0.266

q1*=2/15»0.133, q2*=8/15»0.534, q3*=5/15»0.333

v»0, p1= q1 =1/4=0.25, p2= q2 =1/2=0.5, p3= q3 =1/4=0.25

<== предыдущая лекция | следующая лекция ==>
Задачи, приводимые к матричным играм | Графический метод. Если матричная игра имеет размерность 2хn или mx2, то найти оптимальные смешанные стратегии можно графически
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 933; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.016 сек.