КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 3. Лекция 10. Решение антагонистических игр на основе удаления доминируемых стратегий. Принцип доминирования
Рассмотрим один из способов редуцирования игр, основанный на принципе доминирования, который позволяет в некоторых случаях игру с матрицей большего размера свести к игре с матрицей меньшего размера. Пусть имеем игру с матрицей A размера m*n.
Каждой смешанной (в частности, чистой) стратегии Р=(р1, р2,…, рm) игрока A поставим в соответствие строку (H(P, B1), H(P, B2),…, H(P, Bn)) (2.11.1) (размера 1хn), элементами которой являются выигрыши H(P, Bj), j=1,2,…,n, игрока А в ситуациях (P, Bj), j=1,2,…,n. Строку (2.11.1) можно представить так:
(2.11.2.) откуда видно, что она является выпуклой комбинацией строк матрицы А (выпуклой потому, что коэффициенты р1, р2,…, рm неотрицательны и в сумме дают единицу). Обратно, каждой выпуклой комбинации (2.11.2) строк матрицы А с коэффициентами р1, р2,…, рm поставим в соответствие смешанную стратегию Р=(р1, р2,…, рm) игрока А. Таким образом, между смешанными (в том числе и чистыми) стратегиями
строк (а i1, а i2,…, а in), i=l,,.., m, матрицы А устанавливается взаимно-однозначное соответствие
(2.11.3.)
Из (2.11.1) или (2.11.3) ясно, что каждой чистой стратегии Ak, k =l, 2,...,m, игрока А ставится во взаимно-однозначное соответствие k-я строка (а k1, а k2,…, а kn), матрицы А. Если для двух выпуклых комбинаций строк матрицы А (2.11.4.) и (2.11.5.) выполняются неравенства: (2.11.6.) то говорят, что строка (2.11.5) доминирует строку (2.11.4), а строка (2.11.4) доминируется строкой (2.11.5). Таким образом, строка (2.11.5) — доминирующая строку (2.11.4), а строка (2.11.4) — доминируемая строкой (2. 11. 5).
Если каждое из неравенств (2.11.6) является равенством, то строки (2.11.4) и (2.11.5) называют дублирующими друг друга. Каждая из двух дублирующих строк является одновременно и доминируемой, и доминирующей другую.
Если каждое из неравенств (2.11.6) является строгим, то говорят, что строка (2.11.5) строго доминирует строку (2.11.4), а строка (2.11.4) строго доминируется строкой (2.11.5), или строка (2.11.5) является строго доминирующей строку (2.11.4), а строка (2.11.4) является строго доминируемой строкой (2.11.5).
Аналогичная терминология используется и для соответствующих стратегий игрока А. А именно, если строка (2.11.5) доминирует, соответственно дублирует, соответственно строго доминирует строку (2.11.4), то говорят, что стратегия Р" = (р1", р2",…, рn") доминирует, соответственно дублирует, соответственно строго доминирует стратегию Р' = (p1', p2',…, pn').
Так как элементами строк, соответствующих по (2.11.3) смешанным стратегиям, являются выигрыши игрока А (см. (2.11.1)), то из данных определений понятно, что для игрока А дублирующие стратегии равнопредпочтительны, а доминируемая не дублирующая стратегия заведомо для него невыгодна.
Аналогично, каждой смешанной (в частности, чистой) стратегии Q=(q1, q2,…, qn) игрока В поставим в соответствие столбец
(2.11.7.)
(размера mx1) его проигрышей H(Ai, Q), i=1,..., m, в ситуациях (Ai, Q), i=1,..., m. Используя формулы (2.8.7), столбец (2.11.7) можно представить следующим образом: (2.11.8.) Отсюда видно, что столбец (2.11.7) является выпуклой комбинацией столбцов , матрицы A с коэффициентами q1, q2,…, qn. Обратно, каждой выпуклой комбинации (2.11.8) столбцов матрицы А с коэффициентами: Поставим в соответствие смешанную стратегию Q=(q1, q2,…, qn) игрока В. Таким образом, между смешанными и чистыми стратегиями Q=(q1, q2,…, qn) € Sb игрока В и выпуклыми комбинациями столбцов , матрицы А устанавливается взаимно-однозначное соответствие (2.11.9.) По которому, в частности, каждой чистой стратегии Bl, l=1,…,n, игрока В ставится во взаимно-однозначное соответствие l-й столбец матрицы А (см. также(2.11.7.)). Если для двух выпуклых комбинаций столбцов матрицы А (2.11.10) и (2.11.11.) справедливы неравенства (2.11.12.)
то говорят, что столбец (2.11.10) (стратегия Q' = (q1', q2',…, qn')) доминирует столбец (2.11.11) (стратегию Q" = (q1", q2",..., qn")), а столбец (2.11.11) (стратегия Q") доминируется столбцом (2.11.10) (стратегией Q').
В случае, когда каждое неравенство (2.11.12) является равенством, столбцы (2.11.10) и (2.11.11) (стратегии Q' и Q") называются дублирующими.
Если каждое неравенство (2.11.12) является строгим, то столбец (2.11.10) (стратегия Q') называется строго-доминирующим (строго доминирующей) столбец (2.11.11) (стратегию Q"), а столбец (2.11.11) (стратегия Q") — строго доминируемым (строго доминируемой) столбцом (2.11.10) (стратегией (Q').
Поскольку элементами столбцов, соответствующих по (2.11.9) смешанным стратегиям игрока В, являются его проигрыши, то для него дублирующие стратегии равнопредпочтительны, а доминируемая не дублирующая стратегия заведомо невыгодна. Таким образом, по данным определениям и для игрока А, и для игрока В предпочтительными оказываются доминирующие стратегии. Теорема 1 Справедливы следующие предложения: 1) Если k-я строка, k€ ۟ {l,...,m}, матрицы А игры, доминируется некоторой выпуклой комбинацией остальных ее строк, то существует оптимальная смешанная 2) Если k-я строка, k€ ۟ {l,...,m}, матрицы А игры, строго доминируется некоторой выпуклой комбинацией остальных ее строк, то в любой оптимальной смешанной стратегии Р° = (p1°,..., pm°) игрока А чистая k-я стратегия Ak выбирается 3) Если l-й столбец, l€{1,...,n), матрицы А игры, доминируется некоторой выпуклой комбинацией остальных ее столбцов, то существует оптимальная смешанная стратегия игрока В, в которой l-я чистая стратегия Вl выбирается им с нулевой вероятностью, т.е. ql =0. 4) Если 1-й столбец, l€{1,...,n}, матрицы A игры, строго доминируется некоторой выпуклой комбинацией остальных ее столбцов, то в любой оптимальной Утверждение 2) теоремы 2.11.1 означает, что если k-я строка матрицы игры строго доминируется некоторой выпуклой комбинацией остальных ее строк, то ее нужно удалить, поскольку чистая стратегия Ak априори невыгодна игроку А. Аналогичные замечания относятся к доминируемым столбцам матрицы игры в утверждениях 3) и 4).
Дата добавления: 2014-01-04; Просмотров: 856; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |