КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Игры двух лиц с нулевой суммойПусть в игре участвует два игрока A и Б, партия состоит из одного хода игрока A и ответного хода игрока Б. Ход игрока A заключается в выборе одной из n возможных стратегий . Ход игрока Б состоит из выбора одной из m возможных стратегий . Каждая партия игры состоит в том, что партнеры выбирают по одной своей стратегии, в результате чего определяются платежи игрокам. Пусть игрок A выбирает стратегию , игрок Б - стратегию . В результате осуществления операции платеж игрока A игроку Б составляет , а платеж игрока Б игроку A . Такая игра является игрой с нулевой суммой, так как выигрыш игрока А равен проигрышу игрока Б. Игры, для которых сумма платежей одинакова для всех возможных партий, называются играми с нулевой суммой. Итак, мы рассматриваем конечную игру двух лиц с нулевой суммой. Для нее можно составить матрицу платежей, которая полностью характеризует игру. Игра, заданная платежной матрицей, называется прямоугольной или матричной игрой, приведенной к нормальной форме. В каждой партии игрок A стремится так выбрать свою стратегию , чтобы величина его платежа была минимально возможной. В свою очередь игрок Б стремится так выбрать стратегию , чтобы максимизировать выигрыш. Задача состоит в том, чтобы указать оптимальные стратегии каждой стороны, т.е. такие стратегии, которые при многократном повторении игры обеспечивают Б максимально возможный средний выигрыш, а игроку А - минимально возможный средний проигрыш. Решение игровых задач основывается на принципе минимакса. Этот принцип предписывает игрокам выбирать свою стратегию в расчете на наихудший для себя образ действий противника. Суть этого принципа понятна из следующих рассуждений. Рассмотрим ситуацию с позиции игрока A. На каждую выбранную стратегию игрок Б ответит такой стратегией , чтобы максимизировать выигрыш . Следовательно, из всех возможных стратегий игроку А следует выбрать такую, чтобы минимизировать проигрыш. В этом случае . Определенная так величина a называется верхней ценой игры или минимаксом, а стратегия - минимаксной стратегией A. Верхняя цена игры - это тот гарантированный уровень, больше которого A не заплатит при любом поведении Б, если будет применять свою минимаксную стратегию . Рассмотрим теперь ситуацию с позиции игрока Б. При каждой стратегии сторона A применит такую стратегию , чтобы проиграть как можно меньше: . Следовательно, наилучший из наихудших для Б вариантов отвечает такой стратегии , что . Величина b, определенная таким образом, называется нижней ценой игры или максимином. Нижняя цена игры b - гарантированный выигрыш Б при любом ответе A. Если , то минимаксные стратегии игроков являются оптимальными, т.е. если один из игроков воспользуется минимаксной стратегией, а другой не следует своей минимаксной стратегии, то это может только уменьшить выигрыш (увеличить проигрыш) этого игрока. В общем случае . Равновесие пары стратегий определяется для игры двух лиц так же, как и в общем случае игры n лиц. То, что платеж описывается скалярной величиной, а не вектором, упрощает дело. Ситуация равновесия пары стратегий известна так же, как седловая точка. Def. Седловой точкой называется некоторый элемент матрицы платежей R такой, что при любых i, j. Таким образом, седловая точка одновременно является наибольшим элементом строки k и наименьшим элементом столбца l. Если в некоторой игре существует более одной седловой, то представляет интерес следующая теорема. Теорема. Пусть и - седловые точки. Тогда и также являются седловыми точками и, кроме того . Кратко данную теорему можно выразить так: седловые точки эквивалентны и взаимозаменяемы. Следует отметить, что сформулированное свойство не распространяется на другие игры, т.е. не выполняется для игр с ненулевой суммой или для игр трех и более лиц. Теорема. Пусть - седловая точка игры с матрицей R. Тогда . И наоборот, если , то существует седловая точка , причем . Если , то матричная игра не имеет седловой точки, и минимаксные стратегии не дают решения игры, так как не являются наилучшими ни для одной из сторон. В этом случае говорят, что игра не имеет решения в чистых стратегиях.
Дата добавления: 2015-06-04; Просмотров: 1051; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |