Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Игры с природой




 

Раздел посвящен ситуации, когда один из игроков (он ассоциируется со вторым игроком, Плательщиком) принимает решения о выборе стратегии не рационально, стремясь оптимизировать величину платежа, а каким-либо другим способом. Такое поведение можно назвать не экономическим, а стихийным. Соответственно, для рационального выбора оптимальной стратегии первого игрока используются специальные приемы, учитывающие такое «поведение» второго, и некоторые дополнительные факторы, влияющие на принятие решений. В частности, возможность тяжких, катастрофических последствий при ошибке, и прогностические оценки вероятностей реализации стратегий второго игрока, если такие доступны. Суть приемов раскрыта ниже, в приводимом примере.

По аналогии с теорией антагонистических игр, возможные результаты взаимодействия сводятся в «платежную матрицу». Она содержит величины выгоды, получаемой активным и рациональным (первым) игроком при разных вариантах реализации взаимодополняющих и взаимоисключающих гипотез о «поведении» второго игрока (что моделируется как «выбор» столбца) и одной из стратегий, доступных первому игроку. Наличие в матрице отрицательных значений отражает возможность убытков. Могут быть известны также вероятности реализации гипотез о «поведении природы».

Активный игрок принимает решение о выборе строки до того, как получена информация о выборе столбца. Принятое решение не влияет на «поведение природы», кооперация и изменение решения «в процессе взаимодействия» невозможны.

Пример 12. Для данной платежной матрицы

- Упростить данную платежную матрицу, исключив из неё доминируемые строки, соответствующие заведомо невыгодным стратегиям активного игрока;

- восстановить пропущенную вероятность одной из гипотез о «поведении природы» и выявить оптимальную стратегию активного игрока по математическому ожиданию прибыли;

- выявить оптимальные стратегии активного игрока, применяя оптимистический и пессимистический (Вальде) критерии, критерии Гурвица (при g = 0,3), Сэвиджа.

 

Решение

1. Первый игрок имеет пять стратегий, а второй, «природа», характеризуется четырьмя возможными гипотезами. Известны вероятности реализаций первых трех гипотез. Введем обозначения стратегий активного игрока – «получателя выгоды» и «природы»

  П1 П2 П3 П4  
А 1     -4  
А 2 -4 -5   -5
А 3        
А 4       -5
А 5   -3    

2. Сравним строки данной платежной матрицы для выявления заведомо невыгодных игроку стратегий

 

  П1 П2 П3 П4  
А 1 и А 2 6>-4 3>-5 -4<2 6>-5
А 1 и А 3 6>5 3<8 -4<1 6>0
А 1 и А 4 6>3 3>0 -4<1 6>-5
А 1 и А 5 6<7 3>-3 -4<3 6>4
А 2 и А 3 -4<5 -5<8 2>1 -5<0
А 2 и А 4 -4<3 -5<0 2>1 -5= -5
А 2 и А 5 -4<7 -5<-3 2<3 -5<4
А 3 и А 4 5>3 8>0 1=1 0>-5
А 3 и А 5 5<7 8>-3 1<3 0<4
А 4 и А 5

Вывод: в выделенных строках знаки неравенств – одинаковые, что указывает на невыгодность стратегий активного игрока А 2 и А 4 относительно стратегий А 5 и А 3 соответственно. Дальнейшее сравнение со стратегией А 4 не проводилось.

Платежную матрицу можно упростить, удалив из неё строки, соответствующие выявленным невыгодным стратегиям (они выделены в таблице).

  П1 П2 П3 П4              
А 1     -4       П1 П2 П3 П4  
А 2 -4 -5   -5   А 1     -4  
А 3         ~ А 3        
А 4       -5   А 5   -3    
А 5   -3                  

2. Восстановим вероятность возможного варианта П4 «поведения» природы, исходя из того, что события П1, П2, П3 и П4 образуют полную группу

Рассчитаем математическое ожидание дискретной случайной величины – получаемой игроком выгоды, при возможном использовании каждой его стратегии

 

  П1 П2 П3 П4 Mi Расшифровка
Pj 0,24 0,11 0,38 0,27
А 1     -4   1,87
А 3         2,46
А 5   -3     3,57

 

Вывод: при многократном взаимодействии оптимальной является стратегия А 5, обеспечивающая приближение величины среднего «платежа» к значению m = 3,57. При этом иногда (в одиннадцати процентах случаев) игрок будет нести убыток.

3. Оптимистический критерий состоит в выявлении такой стратегии рационального игрока, которые позволяют получить наибольшую выгоду (при наиболее удачном стечении обстоятельств). Этой стратегии соответствует максимальный элемент в платежной матрице. Критерий используется в ситуациях невысокой ответственности за возможную ошибку.

Проведем сравнение максимальных значений выгоды для каждой отдельной стратегии рационального игрока

  П1 П2 П3 П4  
Pj 0,24 0,11 0,38 0,27    
А 1     -4    
А 3          
А 5   -3      

 

Вывод: максимальная выгода m = 8 может быть получена при реализации стратегии А 3. (Принимая во внимание известные вероятности гипотез о «поведении природы» заметим, однако, что вероятность такого события довольно низка – 11 %).

4. Пессимистический критерий (критерий Вальде) состоит в реализации такого же подхода при выборе стратегии, как при взаимодействии с рационально действующим партнером, нацеленным на минимизацию величины платежа. Соответственно, оптимальной считается стратегия, реализующая «нижнюю цену» игры. Критерий применяется в случаях чрезвычайно высокой ответственности за промах, для предотвращения катастрофических убытков.

Обратим внимание на минимальные значения в строках платежной матрицы

  П1 П2 П3 П4  
А 1     -4   -4
А 3          
А 5   -3     -3

Нижняя цена игры

(реализуется при использовании стратегии А 3).

Вывод: при реализации стратегии А 3 все платежи – неотрицательные, что обеспечивает отсутствие убытков. Выбор других стратегий может привести к убыткам.

5. Критерий Гурвица является промежуточным между двумя предыдущими и опирается на заранее оцененную «меру ответственности» – величину, принимающую значения от gmin = 0 при отсутствии тяжких последствий (катастрофических убытков) до gmax = 1 при их возможности. Для каждой стратегии игрока рассчитывается вспомогательная величина

которая является основой для принятия решения о выборе стратегии.

Произведем расчет величины G i при значении g = 0,3 для каждой стратегии и сделаем вывод

  П1 П2 П3 П4 G i Расшифровка
А 1     -4   -4   -1
А 3             2,4
А 5   -3     -3    

Вывод: при данном «уровне ответственности» оптимальной является стратегия А 3. Она обеспечивает наиболее привлекательные результаты и при наилучшем, и при наихудшем вариантах развития событий. (Отметим, что для данной платежной матрицы такой вывод повторился бы при любом значении параметра g, так как стратегия А 3 отвечает одновременно и оптимистическому, и пессимистическому критериям).

6. Для применения критерия Сэвиджа переработаем платежную матрицу. Предположим, что реализуется одна из гипотез о «поведении» природы. Тогда потери, вызванные неправильным выбором стратегии, определяются разностью между максимальным элементом в столбце платежной матрицы и элементом выбранной стратегии

Элементы такой матрицы («матрицы рисков») показывают величину возможного «сожаления» о том, что выбор остановился на конкретной стратегии, при условии, что «поведение» природы было бы известно. Оптимальной является стратегия, уменьшающая максимальный риск.

В рассматриваемом случае получаем матрицу рисков

 

  П1 П2 П3 П4   П1 П2 П3 П4    
А 1 7-6 8-3 3-(-4) 6-6            
А 3 7-5 8-8 3-1 6-0 =          
А 5 7-7 8-(-3) 3-3 6-4            

Вывод: по данному критерию оптимальной является стратегия А 3, допускающая максимальный риск 6 ед. Заметим, с учетом известных вероятностей гипотез о «поведении» природы, что стратегия А 5 содержит два нуля, т. е. дважды может быть названа наилучшей по столбцу платежной матрицы, но в ней же – наибольший риск величиной 11 ед.

Ответ

– исключение доминируемых строк позволяет упростить платежную матрицу, сохранив стратегии А 1, А 3, А 5;

– вероятность гипотезы П4 – 27 %;

– оптимальной по математическому ожиданию прибыли является стратегия А 1;

– оптимальной по оптимистическому и пессимистическому (Вальде) критериям, а также по критериям Гурвица (при  = 0,3) и Сэвиджа является стратегия А 3.





Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 884; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.02 сек.