КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Лекция 15. Решение игр в смешанных стратегиях
15.1. Постановка задачи При отсутствии седловой точки среди чистых стратегий приходится искать таковую среди смешанных. Применение минимаксных стратегий обеспечивает первому игроку выигрыш не меньше α, а второму – проигрыш не больше β. Поскольку α < β, для игрока 1 естественно желание увеличить выигрыш, а для игрока 2 – уменьшить проигрыш. Поиск такого решения приводит к использованию сложной стратегии, состоящей в случайном применении двух или более чистых стратегий с определенными частотами. Такая сложная стратегия в теории игр называется смешанной. Каждый из игроков применяет свои стратегии независимо от другого игрока. Смешанной стратегией игрока А называется применение чистых стратегий A1, A2, …,Am c вероятностями p1, p2, …,pm. Смешанную стратегию первого игрока обозначают как вектор: P = (p1, p2,…,pm), где p1 + p2 +…+ pm = 1 и p1, p2, …,pm ≥0 Смешанной стратегией игрока B называется применение чистых стратегий B1, B2, …,Bn c вероятностями q1, q2, …,qn. Смешанную стратегию первого игрока обозначают как вектор: Q = (q1, q2,…,qn), где q1 + q2 +…+ qn = 1 и q1, q2, …,qn ≥0 Если игрок 1 прибегает к своему выбору i с вероятностью pi, а игрок 2 - к своему j -му выбору с вероятностью qj, то, поскольку стратегии выбираются игроками независимо, вероятность выбора пары стратегий равна произведению xi, yj, и математическое ожидание выигрыша игрока 1 в смешанных стратегиях { P,Q } равно . Игра имеет решение в смешанных стратегиях, если есть такие оптимальные стратегии x *, y * и число G такое, что при любых смешанных стратегиях x и y выполняется соотношение G(x,y*)≤G≤G(x*,y) Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры V, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных стратегий. Теорема фон Неймана утверждает, что любая матричная игра с нулевой суммой всегда имеет седловую точку, т.е. существуют векторы P и Q такие, что (V - цена игры). Поиск цены игры и соответствующих вероятностей сводится к решению пары двойственных задач:
Если учесть, что при увеличении элементов матрицы A на любую константу С цена игры увеличится на С и это изменение не окажет влияния на искомые вероятности выборов, то всегда можно добиться положительности элементов матрицы и, следовательно, цены игры. В предположении V > 0 можно провести замену переменных Хi = Pi / V, Yj = Q j / V и поставленные задачи преобразовать к задачам с меньшим числом переменных:
X – 1-й игрок, Y- 2-й игрок. Т.к игрок A старается увеличить свой выигрыш, т.е. цену игры v, то выражение 1/v будет стремиться к минимуму. Т.к игрок B старается уменьшить свой проигрыш, т.е. цену игры v, то выражение 1/v будет стремиться к максимуму Пример 1. Для игры с матрицей возникают задачи: 2-й игрок 1-й игрок Решение этих задач симплексным методом дает оптимальные значения X = { 11/37, 4/37, 5/37 }, Y = { 8/37, 7/37, 5/37 } и экстремумы целевых функций, равные 20/37. Отсюда V = 37/20,
Пример 2. Найти оптимальные стратегии и цену игры в игре 3×3 с платежной матрицей Сформулируем двойственные задачи линейного программирования
Текст m.script clc; f=[1 1 1]; A=[4 2 0 0 5 0 2 1 3]; A=-A; b=[1;1;1]; b=-b; lb=[0 0 0]; X=linprog(f,A,b,[],[],lb,[]); disp(X); fopt=f*X; v=1/fopt; disp(v); P=X/fopt; disp(P); Решение этих задач симплексным методом дает оптимальные значения X = { 0.2903, 0.3871, 0.3226 }, V= 1.9355 Дадим объяснение полученному ответу. Выигрыш игрока А составит 60/31 ден.ед. Проигрыш игрока В составит 60/31 ден.ед. Игрок А: использует стратегию A1 на 16.1290322580645 %; использует стратегию A2 на 19.3548387096774 %; использует стратегию A3 на 64.5161290322581 %. Игрок B: использует стратегию B1 на 29.0322580645161 %; использует стратегию B2 на 38.7096774193548 %; использует стратегию B3 на 32.258064516129 %. Следует учесть, что мы здесь ограничиваемся рассмотрением игр, реализация которых может осуществляться любое число раз, не зависит от результата предыдущих действий и от длительности. Игры, где каждый последующий выбор зависит от результата предыдущих действий, относятся к т.н. многошаговым играм и не имеют столь простого решения [1].
Дата добавления: 2014-01-04; Просмотров: 454; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |