Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Графічне розв’язування ігор




Використання критерію максиміну відповідає вибору гравцем 1 таких xi, при яких максимізується найменший очікуваний виграш при виборі гравцем 2 довільної дії. Аналогічно, застосування мінімаксного критерію для гравця 2 означає визначення таких yj, при яких мінімізується найбільший очікуваний програш при виборі гравцем 1 довільної дії. Таким чином, критерій визначення стратегії гравця 1 має вигляд

max{min{ aij xi | j = 1, n}| 0 £ xi £ 1, i = 1, m & xi = 1 },

а стратегії гравця 2 -

min{max{ aij yj | i = 1, m}| 0 £ yj £ 1, j = 1, n & yj = 1 }.

Для кожної конкретної стратегії гравця 1 x0 = (x01, x02, …, x0m) величина min{ aij x0i | j = 1, n} являє собою мінімальне очікуване значення виграшу, яке називають очікуваним максимінним значенням, а для кожної конкретної стратегії гравця 2 y0 = (y01, y02, …, y0n) величина max { aij y0j | i = 1, m } є максимальним очікуваним значенням програшу, яке називають очікуваним мінімаксним значенням. Кожній парі стратегій (x0, y0) відповідає очікуване значення виграшу гравця 1, або програшу гравця 2, що визначається виразом

T0 = aij x0i y0j,

оскільки вибори дій гравцями 1 та 2 можна розглядати як незалежні випадкові події, і тоді x0i y0j є ймовірністю події, у якій значення виграшу (програшу) дорівнює aij.

Якщо отримані в результаті розв’язання задачі значення ймовірностей позначити як x* = (x*1, x*2, …, x*m) та y* = (y*1, y*2, …, y*n), то згідно з відомою теоремою про мінімакс

T* = aij x*i y*j = min{ aij x*i | j = 1, n} = max{ aij y*j | i = 1, m },

тобто для будь-якої матричної гри для оптимальних стратегій очікуване мінімаксне значення дорівнює очікуваному максимінному значенню і дорівнює очікуваному значенню виграшу гравця 1 (програшу гравця 2). Доведення цієї теореми розглянемо пізніше.

У випадку, коли для одного з гравців визначені лише дві можливі дії, матрична гра може бути розв’язана графічним методом. Припустимо, гравець 1 має тільки дві можливі дії. Тоді стратегія цього гравця визначається тільки одним числом x1, оскільки x2 = 1 - x1. Очікуваний виграш гравця 1 при j-й дії гравця 2 являє собою лінійну функцію x1: a1jx1 + a2j x2 = a1j x1 + a2j (1 – x1) = (a1j - a2j) x1 + a2j. Тому пошук оптимальної стратегії гравця 1 зводиться до побудови прямих залежності очікуваного виграшу цього гравця від x1, визначенню ламаної залежності мінімального (по усіх можливих діях гравця 2) очікуваного виграшу гравця 1 від x1, і наступного визначення на побудованій ламаній точки з максимальною ординатою. Після того, як знайдено оптимальну стратегію для гравця 1 оптимальну стратегію для гравця 2 можна визначити, припустивши, що гравець 2 застосовує не більше двох дій з ненульовою ймовірністю при умові, що при цьому розв’язок гри не змінюється.

Таблиця 18.2
Стратегії гравця 2  
Стратегії гравця 1          
        -1
         
             

Розглянемо приклад графічного розв’язування матричної гри з вихідними даними у табл.18.2.

Таблиця 18.3
Дії гравця 2 Очікуваний виграш гравця 1
  (a11 - a21) x1 + a21 = -2x1 + 4
  (a12 - a22) x1 + a22 = - x1 + 3
  (- a13 - a23) x1 + a23 = x1 + 2
  (a14 - a24) x1 + a24 = -7x1 + 6

Рівняння прямих залежності очікуваних виграшів гравця 1 від x1 наведені у табл.18.3, а самі прямі показані на мал. 18.1, де жирною лінією виділена ламана залежності мінімального очікуваного виграшу гравця 1 від x1. Точка з максимальною ординатою на цій ламаній має абсцису x*1 = 1/2, яка і визначає оптимальну стратегію гравця 1.

Для визначення оптимальної стратегії гравця 2 скористаємося тим фактом, що, як прямує з мал.18.1, розв’язок задачі не змінеться, якщо прийняти, що гравець 2 застосовує тільки дві дії 3 і 4 або 3 і 2. Зауважимо, що припустити застосування гравцем 2 тільки двох дій 2 і 4 не можна, оскільки при цьому оптимальна точка змінює своє положення та опиняється на вісі T, а гра стає стабільною.

Таблиця 18.4
Дії гравця 1 Очікуваний програш гравця 2
  (a13 - a14) y*3 + a14 = 4y*3 - 1
  (a23 - a24) y*3 + a24 = -4y*3 + 6

T

6

5

4

3

2

1 x1

 
 


0 x*1 = 1/2 -1

 

Мал.18.1. Графічне розв’язання

матричної гри.

Нехай, гравець 2 використовує дії 3 і 4, тобто y*1 = y*2 = 0, y*3 = 1 - y*4. Очікуваний програш гравця 2 при i-й дії гравця 1 визначається виразом ai3y*3 + ai4y*4 = ai3 y*3 + ai4 (1 - y*3) = (ai3 - ai4)y*3 + ai4. Очікувані програші гравця 2 наведені у табл.18.4. Значення y*3 отримуємо як координату точки перетинання прямих T = 4y*3 – 1 і T = -4y*3 + 6, тобто з рівняння 4y*3 – 1 = -4y*3 + 6. Звідси маємо y*3 = 7/8, а y*4 = 1/8. Таким чином, для гравця 1 отримуємо оптимальну стратегію x*1 = 1/2, x*2 = 1/2, а для гравця 2 - y*1 = 0, y*2 = 0, y*3 = 7/8, y*4 = 1/8. Мінімальний очікуваний виграш гравця 1 (очікуване максимінне значення) отримуємо, підставляючи x*1 = 1/2 у рівняння, наприклад, прямої T = - x1 + 3, T = 2.5. Максимальний очікуваний програш гравця 2 (очікуване мінімаксне значення) отримуємо, підставляючи y*3 = 7/8 у рівняння T = 4y*3 – 1, T = 2.5, що узгоджується з теоремою про мінімакс. Обчислюючи очікуване максимінне значення за формулою

T = aijx*i y*j,

отримуємо

T = 2*(1/2)*0 + 2*(1/2)*0 + 3*(1/2)*(7/8) + (-1)*(1/2)*(1/8) + 4*(1/2)*0 + 3*(1/2)*0 + 2*(1/2)*(7/8) + 6*(1/2)*(1/8) = 21/16 – 1/16 + 14/16 + 6/16 = 2.5.




Поделиться с друзьями:


Дата добавления: 2014-01-13; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.