Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Смешанные стратегии




Лекция № 10

Большинство матричных игр не имеет седловых точек. В такой ситуации игроку важно, чтобы противник не угадал, какую стратегию он будет использовать. Для осуществления этого плана следует пользовать­ся смешанной стратегией. Смешанная стратегия представляет собой схему случайного выбора чистой стратегии. Математически ее можно представить как вероятностное распределение на множестве чистых стра­тегий игрока.

Def. Пусть R – платежная матрица игры размера m×n. Тогда смешанная стратегия игрока Апредставляет собой вектор , удовлетворяющий условиям

,

а смешанная стратегия для игрока Бесть вектор , такой, что

.

Данное определение имеет следующий смысл: когда игрок А ис­пользует смешанную стратегию p, он применяет случайный способ вы­бора стратегии, при котором чистая стратегия выбирается с вероят­ностью , где . Аналогично игрок Б, используя смешанную стратегию q применяет случайный способ выбора стратегии, при кото­ром чистая стратегия выбирается с вероятностью , где Эти две схемы рандомизации будем предполагать независимыми, так что вероятность того, что в партии игрок А выберет стратегию , а игрок Б - , равна . Так как платеж в этом случае равен , математи­ческое ожидание результата игры (средний платеж игрока А при розыг­рыше большого числа партий) выражается формулой

,

или в матричных обозначениях

,

где значок t означает транспонирование.

Для смешанных стратегий седловая точка определяется как пара стратегий удовлетворяющих условию

для любых стратегий , где P и Q - множества допустимых смешанных стратегий игроков А и Б, соответственно.

Теорема. Каждая матричная игра имеет, по крайней мере, одну седловую точку в смешанных стратегиях.

Эта теорема носит название теоремы о минимаксе. Из нее следует, что для любой матричной игры

Величина V обычно называется ценой или значением игры.

Def. Оптимальной называется такая стратегия игрока, которая гарантирует ему (в смысле математического ожидания) выигрыш, равный цене игры.

Таким образом, стратегия оптимальна для игрока А, если

,

и стратегия оптимальна для игрока Б, если

.

Теорема о минимаксе гарантирует существование, по крайней ме­ре, одной оптимальной стратегии для каждого из игроков, т.е. матричные игры всегда имеют решение в смешанных стратегиях, и ниже мы рассмотрим алгоритмы его нахождения.




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 504; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.