Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Тема 3. Решение игр в смешанных стратегиях

В случае, когда в матричной игре отсутствует цена игры в чистых стратегиях, т.е. решение игры найти не удается, используют метод, состоящий в переходе к смешанным стратегиям.

Смешанной стратегией называется случайная величина, значениями которой являются чистые стратегии игрока. Задание смешанной стратегии состоит в указании тех вероятностей, с которыми выбираются чистые стратегии игрока.

Cмешанными стратегиями игроков А и В в матричной игре называются распределения вероятностей на множестве их чистых стратегий, т.е. любые вектора х =(х 1, х 2, …, хm) и y =(y 1, y 2, …, yn) соответственно, обладающие свойствами:

Смешанные стратегии в теории игр представляют собой модель изменчивой, гибкой тактики, когда ни один из игроков не знает, какую чистую стратегию выберет противник в данной партии.

Если игроками выбраны смешанные стратегии (х, у), то функция выигрыша F (x, y) игрока А определяется равенством:

при этом предполагается независимость выборов игроками А и В своих смешанных стратегий, т.е. каждый игрок производит выбор своего вероятностного вектора, не имея информации о выборе другого игрока.

Седловая точка матричной игры в смешанных стратегиях находится из условия:

где х, у − вероятностные вектора. Общее значение левой и правой части этого равенства называется ценой матричной игры Q в смешанных стратегиях и обозначается через q. Она удовлетворяет двойному неравенству:

где, как и выше, a − нижняя цена, b − верхняя цена матричной игры Q.

Седловая точка (x*, y*) называется оптимальным решением (или решением) матричной игры; вероятностный вектор x* − оптимальной смешанной стратегией игрока А, вероятностный вектор y* − оптимальной смешанной стратегией игрока B.

Основная теорема теории игр − теорема Неймана: каждая конечная матричная игра имеет оптимальное решение (седловую точку) в смешанных стратегиях.

Таким образом, у каждого игрока существует оптимальная смешанная стратегия. Если матричная игра имеет цену в чистых стратегиях (a = b), то оптимальное решение в чистых и смешанных стратегиях совпадают.

Пусть х* = (х* 1, х* 2, …, х*m), y* = (y* 1, y* 2, …, y*n) − оптимальные смешанные стратегии игроков А и В. Если чистые стратегии Аi, Вj входят в оптимальные смешанные стратегии с отличными от нуля вероятностями (х*i >0, y*j >0), то они называются активными стратегиями.

Если х* − оптимальная смешанная стратегия игрока А, а Вj − активная стратегия игрока В (y*j >0), то:

т.е. при любой активной стратегии игрока В выигрыш остается неизменным и равным цене игры q. Если Вk − не активная стратегия игрока В (y*k =0), то:

т.е. выигрыш игрока А будет больше цены игры q.

Таким образом, если игрок А придерживается оптимальной смешанной стратегии, то его выигрыш будет не меньше цены игры при любой чистой стратегии игрока В. Аналогичными свойствами обладают активные стратегии игрока А относительно оптимальной смешанной стратегии у* игрока В.

Множеству оптимальных стратегий можно дать графическую интерпретацию. Для этого в декартовой системе координат строят графики прямых выигрыша F(x, j) для смешанной стратегии x игрока А и чистых стратегий Вj игрока В. Для построения этих прямых применяются средства построения диаграмм в электронных таблицах Excel. Анализируя полученные на диаграмме графики, проводят нижнюю огибающую прямых и находят на ней верхнюю точку. Пересекающиеся в этой точке прямые – стратегии Вj – следует считать активными стратегиями в оптимальном решении рассматриваемой игры.

Для игр с платежными матрицами большой размерности отыскание оптимального решения можно упростить, если уменьшить их размерность путем исключения дублирующих и заведомо невыгодных (доминируемых) стратегий.

Доминирование в теории игр — ситуация, при которой одна из стратегий некоторого игрока дает больший выигрыш, нежели другая, при любых действиях его противников.

Определение 1. Если в платежной матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующее этим строкам (столбцам) стратегии называются дублирующими.

Определение 2. Если в платежной матрице игры все элементы некоторой строки, определяющей стратегию Аi игрока А, не больше (т.е. меньше или некоторые равны) соответствующих элементов другой строки, то стратегия Аi называется доминируемой (заведомо невыгодной).

Определение 3. Если в платежной матрице игры все элементы некоторого столбца, определяющего стратегию Вi игрока В не меньше (т.е. больше или некоторые равны) соответствующих элементов другого столбца, то стратегия Вi называется доминируемой (заведомо невыгодной).

Правило. Решение матричной игры не изменится, если из платежной матрицы исключить строки и столбцы, соответствующие дублирующим и доминируемым стратегиям.

Для упрощения платежных матриц, имеющих седловую точку, используют также следующие свойства матричных игр:

Свойство 1. Если ко всем элементам платежной матрицы прибавить (вычесть) одно и тоже число b, то оптимальные смешанные стратегии игроков не изменятся, только цена игры увеличится (уменьшится) на это число b.

Свойство 2. Если каждый элемент платежной матрицы умножить на положительное число k, то оптимальные смешанные стратегии игроков не изменятся, а цена игры умножится на k.

Уменьшение (редуцирование) размерности платежных матриц, а также приведение их к виду с небольшими по абсолютной величине положительными элементами, значительно облегчает процесс поиска решения.

Рассмотрены принципы аналитического решения задач 2×2 и графоаналитический метод 2× n и m ×2.

<== предыдущая лекция | следующая лекция ==>
Тема 2. Антагонистические игры | Тема 4. Взаимосвязь матричных игр и линейного программирования
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1817; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.