КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
И сотрудничества
Матричная игра как модель конкуренции Пусть игроки – Первый и Второй, играют в матричную игру с матрицей
Математическое ожидание этой с.в., т.е. Предположим сначала, что игроки озабочены только максимизацией среднего дохода за партию игры – обычная цель в таких играх. Тогда игроки будут играть со своими оптимальными стратегиями: Математическое ожидание с. в. Но что же можно назвать риском всей игры? Вычислим дисперсию выигрыша Первого при оптимальных стратегиях игроков.
Так как Заметим, что в сумме Заметим теперь, что если Первый играет со стратегией
Если Теперь можно сделать следующий вывод: Чуть-чуть отойдя от своей оптимальной стратегии (смотрите ниже Пример 1) и таким образом почти не уменьшив свой выигрыш, Первый может значительно уменьшить свой риск. При этом уменьшается и риск Второго, что отвечает и его интересам. Чисто математически можно сказать, что в описанной ситуации риск выигрыша Первого не зависит от его стратегии непрерывно. Рассмотрим подробно пример матричной игры с матрицей Пример 1. Пусть матрица игры есть
-2р1 + 2р2 ≥ р1 ≥ р1 + р2 = 1, р1 - р1,2 ≥ 0, 0 ≤ р1 ≤1. Графическое решение последней задачи показано на следующем рисунке 1:
2 q1* = 2/5. Отметим, что так как матрица игры не имеет седловой точки, то решение можно найти по следующим формулам:
Дисперсия выигрыша Первого при оптимальных стратегиях
Как видно из рис. 2 при отходе Первого от своей оптимальной стратегии вправо, т. е. при увеличении вероятности выбора им 1-й строки. Второй начинает отвечать 1-й чистой стратегией и риск Первого скачком увеличивается до
Аналогичное верно и в отношении Второго. Кратко повторим. Примерная, но достаточно точная зависимость риска Второго в малой окрестности его оптимальной стратегии показана на рис. 3. Как видно из рис. 3, при отходе Второго от своей оптимальной стратегии вправо, т. е. при увеличении вероятности выбора им 1-й строки, Первый начинает отвечать 2-й чистой стратегией, и риск Второго скачком уменьшается до Пусть
Третий столбик доминирует первый и, так как столбцы выбирает Второй игрок, то мы исключаем доминирующий третий столбец. В результате получим платежную матрицу 3´4, которую упростить уже невозможно.
Далее приведем анализ игры на седловую точку. Находим минимумы по строкам ai. Тогда нижняя цена игры a= -5. Найдем максимумы по столбцам bj. Тогда верхняя цена игры b=4. Поскольку a¹b, то решения игры в чистых стратегиях нет. Будем искать решение в смешанных стратегиях. Предварительно прибавим к каждому элементу платежной матрицы константу, равную 7, сделав их неотрицательными. Решение игры при этом не изменится, а цена игры возрастет на 7 и будет больше нуля. Матрица игры примет следующий вид:
В силу теоремы Неймана решение игры сводится к нахождению решений симметричной пары взаимно двойственных задач линейного программирования. Пусть P=(p1;p2;p3); Q=(q1;q2;q3;q4)- стратегии игроков. Найдем сначала Q* Если Второй игрок применяет свою оптимальную стратегию, то Первый игрок не может улучшить свое положение, отступая от своей оптимальной стратегии. Заставим Первого игрока отступать от своей оптимальной стратегии, пользуясь чистыми стратегиямиp1, p2, p3 (а Второй игрок, между тем, придерживается своей оптимальной стратегии Q*). В любом случае проигрыш Второго игрока будет не больше, чем цена игры
4q1 + 11q2 + 2q3 + 13q4 £ 11q1 + 2q2 + 13q3 £
Разделим каждое из неравенств на
Получим
4x1 + 11x2 + 2x3 + 13x4 £ 1, 11x1 + 2x2 + 13x3 £ 1.
Поскольку å qj=1, то переменные x1,x2,x3,x4 удовлетворяют условию j=1
Но Найти вектор x=(x1,x2,x3,x4), который обеспечивает максимум целевой функции Z =x1+x2+x3+x4®max,
9x1 + 4x2 + 11x3 + 2x4 £ 1, 4x1 + 11x2 + 2x3 + 13x4 £ 1, (1) 11x1 + 2x2 + 13x3 £ 1, x1,x2,x3,x4 ³0.
После приведенной задачи к основной задаче линейного программирования найдем ее оптимальное решение симплексным методом: X*=(0; 1/28; 1/14; 1/28), при значении целевой функции Zmax=1/7. Цену игры и Q* найдем по следующей формуле:
В качестве проверки, студент может решить эту задачу с использованием компьютера (см. приложение 12). Найдем теперь оптимальную стратегию P* первого игрока. Если Первый игрок применяет свою оптимальную стратегию, то Второй игрок не может улучшить свое положение, отступая от своей оптимальной стратегии. В случае использования Вторым игроком своих чистых стратегий, а Первым игроком своей оптимальной стратегии, выигрыш Первого будет не меньше, чем цена игры:
4p1 + 11p2 + 2p3 ³ 11p1 + 2p2 + 13p3 ³ 2p1 + 13p2 ³ Разделим каждое из неравенств на
Получим:
4y1 + 11y2 + 2y3 ³ 1, 11y1 + 2y2 + 13y3 ³ 1, 2y1 + 13y2 ³ 1. Поскольку å pi=1, то переменные y1,y2 ,y3 удовлетворяют условию i=1
y1+y2 +y3 = 1/ Но Найти вектор y=(y1,y2 ,y3), который обеспечивает минимум целевой функции: L= y1+y2 +y3®min. При следующих линейных ограничениях:
4y1+ 11y2 + 2y3 ³ 1, (2) 11y1 + 2y2 + 13y3 ³ 1, 2y1 +13y2 ³ 1, y1,y2 ,y3³ 0. Эта задача является двойственной по отношению к рассмотренной выше задаче (1). Решение задачи (2) возьмем из последней симплексной таблицы при решении задачи (1): Уопт = (1/28, 1/14 1/28); Lmin = Zmax = 1/7. Откуда цена игры u0 по-прежнему равна 7. Далее, найдем P* = Отметим, что решение задачи (2) можно также найти с помощью второй основной теоремы двойственности. Возвращаемся теперь к исходной матрице игры A4,5 . Решение этой игры имеет вид:
Найдем риск игры при использовании игроками своих оптимальных стратегий
а также риск при использовании одним из игроков своей чистой, а другим – своей оптимальной стратегии (нижний индекс Первого игрока, верхний – Второго игрока):
i=1
i=1
i=1
j=1
D(p2) (Q*)= åa2j2 qj*- j=1
j=1
Дата добавления: 2015-06-04; Просмотров: 429; Нарушение авторских прав?; Мы поможем в написании вашей работы! |