КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Метод Брауна-Робинсона
Лекция 7 итерационный метод решения Матричной игры
Рассмотрим теперь приближенный метод решения игры― итерационный метод Брауна-Робинсона. В соответствии с заданной матрицей игры она многократно разыгрывается. Начинается с того, что игрок 1 выбирает произвольно одну из своих чистых стратегий, например, xi. Игрок 2 отвечает на это той своей стратегией yj, которая делает минимальным выигрыш при стратегии xi. На это игрок 1 отвечает той своей стратегией xk, которая дает максимальный выигрыш при стратегии yj. Далее игрок 2 отвечает на стратегии xi и xk такой стратегией yl, которая дает наименьший средний выигрыш игроку 1 при этих двух стратегиях xi и xk, и так далее. На каждом шаге итерационного процесса каждый игрок отвечает на любой ход противника той своей стратегией, которая является оптимальной относительно всех его предыдущих ходов, рассматриваемых как некоторая смешанная стратегия, в которой чистые стратегии имеют вероятности, соответствующие относительным частотам их применения. Пусть осуществлено k повторений игры, в которых чистые стратегии xi и yj применялись с относительными частотами , и , . Тогда накопленные средние результаты игры для чистых стратегий xi и yj будут (7.1.1) (7.1.2) где ―результат игры при стратегии xi и стратегии, применяемой игроком 2 на s- м повторении игры, ―результат игры при стратегии yj и стратегии, применяемой игроком 1 на s- м повторении игры. Игроки на (k+ 1) - м повторении игры выбирают те из своих стратегий, для которых средние результаты будут (средний выигрыш игрока 1 максимален, а средний проигрыш игрока 2 минимален) (7.1.3) (7.1.4) При каждом повторении игры каждый из игроков выбирает свою наилучшую чистую стратегию в предположении, что противник использует смешанную стратегию с относительными частотами появления чистых стратегий в предыдущих повторениях игры. Такая процедура выбора наилучших чистых стратегий соответствует практике использования прошлого опыта принятия решений при многих повторениях конфликтных ситуаций, когда каждая сторона, полагая, что противник будет действовать так же, как и в прошлом, выбирает ту стратегию, которая обеспечивала ей наилучший результат. Можно доказать, что средний выигрыш игрока 1 и средний проигрыш игрока 2 стремятся к цене игры (7.1.5) а соответствующие смешанные стратегии , приближаются к оптимальным смешанным стратегиям , . Об окончании итеративного процесса можно судить по величине (7.1.6) Когда при некотором k=N величина Δ(N) становится меньше заданного значения, процесс прекращают и считают, что цена игры (7.1.7) Преимущество итерационного метода решения игр, который сходится довольно медленно, в том, что объем и сложность вычислений медленно возрастают при увеличении числа стратегий m и n.
Дата добавления: 2013-12-13; Просмотров: 2918; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |