КАТЕГОРИИ:

Главная
Случайная страница
Познавательное
Новые статьи
Контакты
Заказать работу

Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Методы определения оптимальных стратегий

⇐ Предыдущая 19 20 21 222324 25 26 27 28 Следующая ⇒

1. Простейший метод состоит в нахождении седловой точки для чистых стратегий. Если такая седловая точка существует, то две чистые стратегии, которые к ней приводят, являются оптимальными.

2. Для уменьшения размерности игры используется доминирование строк и столбцов.

Говорят, что k -я строка матрицы R доминирует i -ю строку (т.е. одна чистая стратегия доминирует другую), если

при всех j.

Аналогично l -й столбец доминирует j -й столбец, если

при всех i.

Заметим, что доминирующая стратегия никогда не хуже, а в некоторых случаях и лучше, чем доминируемая. Игроку невыгодно использовать доминируемую стратегию, и она не должна войти в оптимальную смешанную стратегию. Это позволяет при решении игры все доминируемые строки и столбцы отбросить, т.е. уменьшить размеры матрицы.

Пример

Рассмотрим игру с матрицей

Вторая строка доминирует третью. Исключение третьей строки приводит к матрице

Первый столбец в этой урезанной матрице доминирует второй. Исключение второго столбца приводит к матрице

Найдя решение полученной игры, легко получить решение исходной игры, приписав исключенным строкам и столбцам нулевые вероятности.

3. Существуют простые процедуры получения решения игр малой размерности. Рассмотрим один из них на примере игры 2´2.

Пример

Рассмотрим игру с платежной матрицей

Эта игра не имеет решения в чистых стратегиях, так как

Будем искать решение этой игры в смешанных стратегиях.

Пусть p и q – вероятности выбора игроками А и Б, соответственно, первой чистой стратегии. Тогда и (1-q) – вероятности выбора ими второй чистой стратегии.

Математическое ожидание результата .

Для определения оптимальной стратегии игрока А нужно найти

Сначала при фиксированном значении p необходимо найти максимум по q, а для этого разобьем область изменения p на два интервала [0,0.4] и [ 0.4,1] знакопостоянства выражения (5p-2) и решим эту задачу на каждом из этих интервалов.

;

Итак, мы определили, что оптимальной для игрока А будет смешанная стратегия, при которой первая чистая стратегия выбирается им с вероятностью (или частотой) 0,4, а вторая - с вероятностью 0,6. Цена игры - 3,2.

Аналогично задача решается и для игрока Б.

С ростом размерности матрицы платежей сложность задачи заметно возрастает.

4. Для решения больших игр предложено несколько методов. Наиболее распространенным является определение оптимальной стратегии методами линейного программирования.

Теорема. Каждой матричной игре m´n с платежной матрицей Rэквивалентна следующая пара двойственных задач линейного программирования:

минимизировать целевую функцию при условиях

(1)

максимизировать целевую функцию при условиях

(2)

Составляющие оптимальных смешанных стратегий игры и цена игры V связаны с компонентами оптимальных планов задачи ЛП соотношениями

(3)

Доказательство

Оптимальная стратегия должна обеспечить игроку А проигрыш, не больший V при любом поведении противника. В частности, если игрок Б будет использовать любую чистую стратегию, средний проигрыш не должен превысить V, т.е. должны выполняться следующие неравенства

(4)

Допустим, что все элементы матрицы платежей R положительны. Этого всегда можно добиться, прибавив ко всем элементам матрицы достаточно большое положительное число М; при этом цена игры увеличится на М, а оптимальные стратегии не изменятся.

Тогда V>0 и, разделив неравенства (4) на V, получим

(5)

где

Так как , то .

Гарантированный проигрыш игрока А - V нужно минимизировать, т.е. - максимизировать.

Итак, мы доказали, что задача нахождения оптимальной стратегии игрока А сводится к задаче линейного программирования (2) с m переменными и n ограничениями. Зная оптимальные значения , оптимальную стратегию p и цену игры V можно найти по формулам (3).

Аналогично доказывается, что задача нахождения оптимальной стратегии игрока Б сводится к задаче линейного программирования (2).

Итак, вместо решения матричной игры можно решать эквивалентную ей пару задач линейного программирования.

Справедливо и обратное утверждение: для любой задачи линейного программирования может быть построена эквивалентная ей задача теории игр.

⇐ Предыдущая 19 20 21 222324 25 26 27 28 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2015-06-04; Просмотров: 1434; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.014 сек.