КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Методы определения оптимальных стратегий
1. Простейший метод состоит в нахождении седловой точки для чистых стратегий. Если такая седловая точка существует, то две чистые стратегии, которые к ней приводят, являются оптимальными. 2. Для уменьшения размерности игры используется доминирование строк и столбцов. Говорят, что k -я строка матрицы R доминирует i -ю строку (т.е. одна чистая стратегия доминирует другую), если при всех j. Аналогично l -й столбец доминирует j -й столбец, если при всех i. Заметим, что доминирующая стратегия никогда не хуже, а в некоторых случаях и лучше, чем доминируемая. Игроку невыгодно использовать доминируемую стратегию, и она не должна войти в оптимальную смешанную стратегию. Это позволяет при решении игры все доминируемые строки и столбцы отбросить, т.е. уменьшить размеры матрицы. Пример Рассмотрим игру с матрицей . Вторая строка доминирует третью. Исключение третьей строки приводит к матрице . Первый столбец в этой урезанной матрице доминирует второй. Исключение второго столбца приводит к матрице . Найдя решение полученной игры, легко получить решение исходной игры, приписав исключенным строкам и столбцам нулевые вероятности. 3. Существуют простые процедуры получения решения игр малой размерности. Рассмотрим один из них на примере игры 2´2. Пример Рассмотрим игру с платежной матрицей . Эта игра не имеет решения в чистых стратегиях, так как . Будем искать решение этой игры в смешанных стратегиях. Пусть p и q – вероятности выбора игроками А и Б, соответственно, первой чистой стратегии. Тогда и (1-q) – вероятности выбора ими второй чистой стратегии. Математическое ожидание результата . Для определения оптимальной стратегии игрока А нужно найти
. Сначала при фиксированном значении p необходимо найти максимум по q, а для этого разобьем область изменения p на два интервала [0,0.4] и [ 0.4,1] знакопостоянства выражения (5p-2) и решим эту задачу на каждом из этих интервалов. ; Итак, мы определили, что оптимальной для игрока А будет смешанная стратегия, при которой первая чистая стратегия выбирается им с вероятностью (или частотой) 0,4, а вторая - с вероятностью 0,6. Цена игры - 3,2. Аналогично задача решается и для игрока Б. С ростом размерности матрицы платежей сложность задачи заметно возрастает. 4. Для решения больших игр предложено несколько методов. Наиболее распространенным является определение оптимальной стратегии методами линейного программирования. Теорема. Каждой матричной игре m´n с платежной матрицей Rэквивалентна следующая пара двойственных задач линейного программирования: минимизировать целевую функцию при условиях (1) максимизировать целевую функцию при условиях (2) Составляющие оптимальных смешанных стратегий игры и цена игры V связаны с компонентами оптимальных планов задачи ЛП соотношениями (3) Доказательство Оптимальная стратегия должна обеспечить игроку А проигрыш, не больший V при любом поведении противника. В частности, если игрок Б будет использовать любую чистую стратегию, средний проигрыш не должен превысить V, т.е. должны выполняться следующие неравенства (4) Допустим, что все элементы матрицы платежей R положительны. Этого всегда можно добиться, прибавив ко всем элементам матрицы достаточно большое положительное число М; при этом цена игры увеличится на М, а оптимальные стратегии не изменятся. Тогда V>0 и, разделив неравенства (4) на V, получим (5) где Так как , то . Гарантированный проигрыш игрока А - V нужно минимизировать, т.е. - максимизировать.
Итак, мы доказали, что задача нахождения оптимальной стратегии игрока А сводится к задаче линейного программирования (2) с m переменными и n ограничениями. Зная оптимальные значения , оптимальную стратегию p и цену игры V можно найти по формулам (3). Аналогично доказывается, что задача нахождения оптимальной стратегии игрока Б сводится к задаче линейного программирования (2). Итак, вместо решения матричной игры можно решать эквивалентную ей пару задач линейного программирования. Справедливо и обратное утверждение: для любой задачи линейного программирования может быть построена эквивалентная ей задача теории игр.
Дата добавления: 2015-06-04; Просмотров: 1434; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |