Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лекція 27




ЕЛЕМЕНТИ ТЕОРІЇ СТАТИСТИЧНИХ РІШЕНЬ

В задачах теорії ігор, розглядаючи операції, що проводяться в умовах невизначеності, ми пов'язували цю невизначеність з невідомою для нас поведінкою супротивника і виходили з того, що цей супротивник є "розумним і зловмисним" і приймає ті і саме ті дії, які для нас найменш вигідні. Однак, при дослідженні операцій доводитися стикатися не тільки з таким видом невизначеності. Дуже часто невизначеність, що супроводжує операцію, пов'язана не з свідомою протидією противника, а просто з нашого недостатньою обізнаністю про умови, в яких буде проводитися операція. Так, наприклад: кліматичні умови, купівельний попит і т.д. У всіх такого роду випадках умови виконання операції залежать не від свідомо протидіючого противника, а від об'єктивної дійсності, яку в теорії рішень прийнято називати природою. Відповідна ситуація називається "грою з природою", Природа в теорії статистичних рішень розглядається як якась незацікавлена ​​інстанція, поведінка якої невідомо і не містить елемента свідомої протидії нашим планам.(Табл.27.1)

 

Розглянемо такого роду ситуацію. Нехай у нас (сторона А) є m всіляких стратегій: що стосується обстановки, то про неї можна зробити n припущень - розглянемо їх як стратегії природи. Наш виграш при кожній парі стратегій заданий матрицею. Потрібно вибрати таку стратегію гравця А, яка є кращою.

З першого погляду ця ситуація простіше ігровій. Але справа в тому, що в ігровій конфліктній ситуації припущення щодо діаметральної протилежності інтересів противника нашим в деякому сенсі як би знімає невизначеність. Якщо ж такого припущення зробити не можна, невизначеність позначається в набагато більш сильному ступені,

Найбільш простим випадком вибору режиму в умовах невизначеності є випадок, коли якась із стратегій гравця А перевершує інші, як наприклад:

 

Таблиця 27.2

 

Таблиця 27.3

У цій таблиці виграш при стратегії при будь-якому стані природи не менше, ніж виграш при будь-якій іншій стратегії. Значить стратегія є кращою. Якщо ж в матриці немає домінуючої стратегії, все ж слід переглянути її під кутом зору стратегій, свідомо невигідних для гравця, гірших, ніж принаймні одна з інших, або дублюючих, які треба відкинути (спрощення ігор). Наприклад, у наведеній таблиці можна відкинути стратегії завідомо невигідні в порівнянні з і стратегію - у порівнянні с, в результаті чого матриця зведеться до матриці 2х5.

Звернемо увагу на наступне: у грі проти розумного противника ми б відкинули за нього стратегію як невигідну порівняно с, а в порівнянні с. У грі проти природи цього робити не можна, так як природа не вибирає свою стратегію так, щоб найбільше нам нашкодити.

Вводиться поняття ризику. Ризиком гравця при використанні стратегії, в умовах називається різниця між виграшем, який він одержав би, якби знав, і виграшем, який він отримає в тих же умовах, застосовуючи стратегію.

Позначимо ризик гравця при його стратегії в умовах. Висловимо ризик через елементи матриці виграшів. Очевидно, якби гравець знав заздалегідь стан природи, він вибрав би ту стратегію, якій відповідає максимальний виграш в даному стовпці,. Відповідно до визначення ризику, де. З цього визначення випливає, що ризик не може бути негативним. При обчисленні ризику, відповідного кожній стратегії в даних умовах, враховується загальна сприятливість або не сприятливість для нас даного стану природи. Матриця дає часто більш наглядну картину невизначеній ситуації, ніж матриця виграшів.

Розглянемо деякі критерії вибору оптимальних рішень в умовах невизначеності.

Найбільш просто вирішується задача про вибір рішення в умовах невизначеності, коли нам хоча і невідомі умови виконання операції, але відомі їх імовірності,;.

В цьому випадку в якості показника ефективності, який ми прагнемо звернути в максимум, природно взяти середнє значення, чи математичне сподівання виграшу, з урахуванням ймовірностей всіх можливих умов. Позначимо це середнє значення для i-й стратегії гравця через.

Очевидно, є не що інше, як зважене середнє виграшів i-го рядка, взятих з вагами. В якості оптимальної стратегії природно вибрати ту, для якої - максимально. При виборі оптимальної стратегії в невідомих умовах з відомими ймовірностями можна користуватися не тільки середнім виграшем, але і середнім ризиком який зрозуміло потрібно звернути не в максимум, а в мінімум.

Однак, часто зустрічаються випадки, коли приступаючи до виконання операції, ми не маємо уявлення про ймовірності станів природи. Всі наші відомості зводяться до переліку варіантів станів, а оцінити їх ймовірність ми не можемо. Зрозуміло, в таких випадках ймовірності умов можуть бути оцінені суб'єктивно: деякі з них видаються нам менш, деякі більш правдоподібними, Так, якщо ми не можемо віддати перевагу ні одній гіпотези, якщо всі вони для

 

нас рівноправні, то природно призначення їх ймовірностей рівними один одному:

 

Це так званий принцип недостатньої основи Лапласа. Є інші методи, наприклад, метод опитування експертів та ін. Крім суб'єктивного призначення ймовірностей станів природи існує ще кілька критеріїв. Зупинимося на деяких з них.

1. Максимальний критерій Вальда,

Згідно з цим критерієм в якості оптимальної вибирається та стратегія гравця А, при якій мінімальний виграш максимальний, тобто стратегія, що гарантує за будь-яких умовах виграш не менший, ніж стратегія, що гарантує за будь-яких умовах виграш не менший, ніж максимін:. Якщо керуватися цим критерієм, треба завжди орієнтуватися на гірші умови і вибирати ту стратегію, для якої в гірших умовах виграш максимальний. Це підхід крайнього песимізму.

2. Критерій мінімального ризику Севіджа,

Цей критерій рекомендує в умовах невизначеності вибирати ту стратегію, при якій величина ризику приймає найменше значення в самій несприятливій ситуації:. Сутність цього критерію в тому, щоб будь-якими шляхами уникнути великого ризику при прийнятті рішення. Цей критерій, як і попередній - критерії крайнього песимізму, але песимізм тут розуміється по іншому: гіршим оголошується не мінімальний виграш, а максимальна втрата виграшу в порівнянні з тим, що можна було б досягти в даних умовах.

 

Де - максимальний виграш.

 

3. Критерій песимізму-оптимізму Гурвіца.

Цей критерій має вигляд

 

де - коефіцієнт, який обирали між нулем і одиницею. При критерій Гурвіца перетворюється на песимістичний критерій Вальда, а при, в критерій крайнього оптимізму - рекомендує вибирати ту стратегію, при якій в найкращих умовах виграш максимальний. При виходить щось середнє між крайнім песимізмом і оптимізмом. Коефіцієнт вибирається із суб'єктивних міркувань - чим не безпечніша ситуація, чим більше ми хочемо в ній підстрахуватися, тим ближче до 1 вибирається.

Клас ігор, що мають сідлову точку, дуже цікавий як з теоретичної, так і з практичної точок зору. До нього належать всі так звані ігри з повною інформацією. Грою з повною інформацією називається така гра, в якій кожен гравець при кожному особистому ході знає результати всіх попередніх ходів - як особистих, так і випадкових.

Серед кінцевих ігор, що мають практичне значення, не так вже й часто зустрічаються ігри з сідловою точкою. Більш типовим є випадок, коли нижня і верхня межі гри різні. Аналізуючи матриці таких ігор, можна прийти до висновку, що якщо кожному гравцеві надати вибір однієї єдиної "чистої" стратегії, то в розрахунку на розумного противника цей вибір має визначатися принципом мінімакса. При цьому гравець А гарантує собі виграш, рівний нижньої ціною гри. Виникає питання: чи не можна гарантувати виграш більший, якщо застосовувати не одну єдину "чисту" стратегію, а чергувати випадковим чином кілька стратегій? Такі стратегії, що складаються у випадковому чергуванні чистих стратегій, називаються змішаними. При користуванні змішаною стратегією перед кожною партією гри пускається в хід якийсь механізм випадкового вибору, забезпечуючий появу кожній стратегії з деякою вірогідністю, і потім приймається та стратегія, на яку впав жереб. Введемо спеціальне позначення для змішаних стратегій. Нехай є гра І, в якій у нас m стратегій, а у противника - n стратегій. Будемо позначати нашу змішану стратегію, в якій стратегії застосовуються з ймовірністю, причому. Очевидно, чиста стратегія є окремим випадком змішаної стратегії: всі стратегії, крім даної, мають ймовірності рівні нулю, а дана - одиниці.

Виграш, який відповідає рішенню, називається ціною гри. Існує основна теорема теорії ігор: кожна кінцева гра має принаймні одне рішення, можливо, в області змішаних стратегій. Слідство з цієї теореми - кожна кінцева гра має ціну. Ціна гри завжди лежить між нижньою ціною гри і верхньою ціною. Будемо називати активними стратегіями гравця ті, які входять в його оптимальну стратегію (змішану). Позначимо виграш, що утворюється, якщо ми користуємося оптимальною стратегією, а противник - чистими стратегіями. Так як у змішаній стратегії чисті стратегії застосовуються з ймовірностями, причому, то середній виграш буде:

 

У загальному випадку при великих m і n, рішення ігри m x n являє собою досить трудомістку задачу, але принципових труднощів вона не містить. Легко показати, що рішення будь-якої кінцевої гри може бути зведене до вже відомої нам задачі лінійного програмування (в ролі невідомих виступають ймовірності, які лінійно пов'язані з середнім виграшем).

Найбільш простим випадком кінцевої гри є гра 2х2. Вирішенню такої гри можна дати зручну геометричну інтерпретацію.

Нехай є гра 2х2 з матрицею

 

Таблиця 27.4

Візьмемо ділянку осі абсцис довжиною одиниця (рис. 27.2). Лівий кінець ділянки буде зображувати стратегію, правий кінець ділянки - стратегію, всі проміжні точки ділянки будуть зображувати змішані стратегії гравця А, причому ймовірність стратегії буде дорівнювати відстані від точки до правого кінця ділянки, а ймовірність стратегії - відстані до лівого кінця. Проведемо через точки і два перпендикуляра до осі абсцис. На першій осі будемо відкладати виграш при стратегії, на другій - при. Нехай противник застосовує стратегію. Вона дає на наших осях відповідно точки з координатами і. Проведемо через ці точки пряму. Очевидно, при будь змішаної стратегії наш виграш виразиться точкою N на прямій, відповідній точці на осі абсцис, що ділить відрізок у відношенні. Пряму умовно будемо називати стратегією.

Очевидно, точно таким же способом може бути побудована і стратегія. Нам потрібно знайти оптимальну стратегію, тобто таку, при якій наш мінімальний виграш (при найгіршій для нас поведінці В) звертався б в максимум. Для цього побудуємо нижню межу виграшу при стратегіях, тобто ламану лінію. На цьому кордоні буде лежати мінімальний виграш гравця А при будь-якій його змішаній стратегії. Точка N, в якій цей виграш досягає максимуму і визначає рішення в ціну гри. Неважко переконатися, що ордината точки N є ціна гри, а - ймовірності стратегій і в оптимальній змішаній стратегії гравця А.

 

Рисунок 27.1

 

Аналогічним чином графічно можуть бути вирішені завдання з розмірністю 2 х n, Для вирішення завдань будь-якої розмірності можуть бути використані методи, наприклад, лінійного програмування.

 

 




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 432; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.