Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Строго выпуклые игры на единичном квадрате




Функция φ(x) называется выпуклой, если для любых двух точек z1 и z2 из множества Z выполняется неравенство:

φ(λz1 + (1-λ)z2 )λφ(z1) + (1- λ)φ(z2),

Если неравенство строгое, то и функция строго выпуклая (если неравенство выполняется строго, то вторая производная φ˝(z)>0).

Опр. Игра Г=<X,Y,a> называется игрой на единичном квадрате, если X=[0,1] и Y=[0,1], а целевая функция a(x,y) определена для каждой точки этого квадрата.

Опр. Игра Г на единичном квадрате называется непрерывной, если функция платежей a(x,y) непрерывна в каждой точке единичного квадрата по обеим переменным.

Опр. Непрерывная антагонистическая игра на единичном квадрате называется выпуклой, если функция a(x,y) строго выпукла по Y для всех xX. Иными словами, для функции платежей в строго выпуклой игре имеет место неравенство:

a(x, λy1 + (1-λ)y2) < λ a(x,y1) + (1- λ) a(x,y2), .

Исходя из свойств строгой выпуклости, .

Теорема. В строго выпуклой игре на единичном квадрате 2-ой игрок имеет единственную оптимальную стратегию, которая является чистой. Цена игры в этом случае v(a), где а — функция платежей.

v(a) = = , где y* — оптимальная чистая стратегия 2-го игрока.

Х* — множество стратегий 1-го игрока, состоящее из тех х*Х*, для которых выполняется условие a(x*,y*) = v(a).

х* — тоже чистые стратегии, они называются существенными стратегиями, а остальные – несущественными.

Нахождение существенных стратегий 1-го игрока основано на выполнении следующих свойств.

1. Если y*=1, то у 1-го игрока существует стратегия х1, для которой

.

Геометрическое истолкование:

При уменьшении y a(x,y) возрастает.

 

2. Если y*=0, то среди стратегий 1-го игрока существует такая стратегия х2, что , y=y*.

 

3. Если имеется значение стратегии 0<y*<1, то у 1-го игрока найдутся 2 существенные стратегии х1 и х2,для которых имеет место условие

, y=y* , y=y*

Оптимальной стратегией 1-го игрока является вероятностная смесь стратегий х1 и х2, причем х1 — с вероятностью р, х2 — с вероятностью (1-р).

— уравнение, позволяющее определить р.

Доказывается, что решение этого уравнения единственно и принадлежит интервалу .

 

Пример. Пусть имеется игра Г=<X,Y,a>, x,y[0,1], функция выигрыша a(x,y) = (x-y)2.

1). Рисуем график функции платежей (выигрыша):

 

2). Проверим функцию платежей на выпуклость.

 

Функция платежей строго выпукла по у. Имеем дело со строго выпуклой игрой на единичном квадрате.

Найдем v=v(a). Для этого рассмотрим функцию:

.

Построим таблицу:

y   0.25 0.5 0.75  
Ψ(y)   0.5625 0.25 0.5625  

y*=0.5

v(a)=0.25

Отсюда видим, что в нашем случае 0<y*<1, а следовательно, у 1-го игрока есть две существенные стратегии: х1 и х2. Для их нахождения рассмотрим зависимость

v(a)=a(x,y*)=(x-y*)2=(x-0.5)2=0.25

x1=0, x2=1 — две существенных чистых стратегии 1-го игрока.

Проверим, что эти решения действительно являются существенными стратегиями (проверка на противоположность производных).

следовательно, оптимальная стратегия 1-го игрока есть вероятностная смесь по стратегиям х=х1 и х=х2. Найдем эти вероятности.

p=0.5

Покажем, что найденное решение является точкой равновесия. Рассмотрим проигрыши 2-ого игрока при оптимальной стратегии 1-ого:

a(x*,y) = p*(x1 - y)2 + (1-p*)(x2 - y)2 = 1/2(-y)2 + 1/2(1-y)2 ,y, следовательно минимум 1/4.

a(x,y*) — выигрыш 1-ого игрока при условии, что 2-ой примет свою оптимальную чистую стратегию.

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 493; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.