Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Стратегия наказания




Игра

Пример

Базовая модель

Изложение основных понятий будет веститсь на примере простой (одноресурсной, однопродуктовой) модели, которую назовем базовой моделью(БМ).

Суть модели заключается в распределении дефицитного ресурса так, чтобы производство продукции было максимальным.

Пусть имеется предприятий (технологий). Каждая технология задаётся производственной функцией

 

- используемый ресурс,

- произведенная продукция.

Наложим на функции условия:

 

Действительно, в этом случае даже, если можно «скорректировать» оптимальную стратегию, заменив ее стратегией

 

где точка (,) удовлетворяет условиям:

(,

(,

,

Величина определяет затраты игрока 1 на стимуляцию игрока 2.

Механизмом такой стимуляции может служить «побочный платеж», обещанный начальником подчиненному.

Игра

В этой игре игрок 2 знает выбор игрока 1 до своего выбора, т.е.:, = (). В свою очередь игрок 1 знает такое правило поведения игрока 2, т.е.

Вспомогательные конструкции

Определим МГР игрока 2:

 

Далее определим стратегию наказания (стратегию, наихудшую для игрока 2)

 

из условия

 

В игре взаимовыгодное множество определяется равенством

 

Напомним, что всегда, поэтому. Определим исход () из условия

 

Построим стратегию игрока 2:

 

где произвольная функция.

Оптимальная стратегия игрока 1имеет вид:

 

 

Содержательно игрок 1 выберет (выдает кредит), если игрок 2 использует этот кредит выбором, при этом игрок 2 получает

В противном случае игрок 1 выбирает и игрок 2 не получит больше.

Теорема 2. При условии доброжелательности игрока 2 оптимальный выигрыш игрока 1 в игре равен а – его оптимальная стратегия.

Доказательство. Аналогично доказательству теоремы 1.

Замечание 1 и 2 к теореме 1 справедливы и для теоремы 2.

Кроме того, в силу имеем, то есть выигрыш игрока 1 в игре больше или равен его выигрышу в игре.

Упражнение

Докажите, что если в антагонистической игре,

существует седловая точка, то

 

Ранее на этом примере, мы строили ситуации равновесия на сложных стратегиях. Теперь проиллюстрируем решение иерархических игр.

Определим множества рациональных ответов игрока 2:

(1) = 3, (1,3) = 7, (1,3) = 2

(2) = 2, (2,2) = 4, (2,2) = 4

(3) = 2, (3,2) = 3, (3,2) = 0

Тогда

 

при =2, =2.

Замечание. Решение игры совпало с ситуацией равновесия по Нэшу на управлениях. В общем случае в этой игре можно получить выигрыш, равный выигрышу в наилучшей для игрока ситуации равновесия (что имеет место в игре «семейный спор») и даже больше.

Игра

В этом случае

 

 

7, что соответствует глобальному максимуму

Оптимальная стратегия игрока 1:

 

 

Выигрыш игрока 2 равен

 

Игра Г3

В этой игре

 

 

Оптимальный выигрыш игрока 1 определяется следующим образом:

 

Построим стратегию игрока 2:

 

 

где произвольная функция.

Оптимальная стратегия игрока 1 имеет вид:

 

 

При этом игрок 2 получит (1,1) = 6 > 3= .

Заметим, что в этом примере = 6 < 7 =

Итак, для поиска решения иерархических игр на классе стратегий вместо решения сложнейших вариационных задач получена процедура сведения этих задач к задачам оптимизации на исходных множествах.

Для этого необходимо проделать следующие вычисления:

1. Найти значение гарантированного выигрыша подчиненного.

2. Определить стратегии наказания начальником подчиненного.

3. Ведением дополнительного неравенства определяется допустимое по интересам и возможностям множество альтернатив подчиненного. Это множество содержит выборы, при которых выигрыш подчиненного не может быть меньше его гарантированного результата.

4. Определяется точка из этого множества, доставляющая максимум функции начальника.

5. Конструируется стратегия начальника, приводящая к реализации этой оптимальной точки и включающей в себя штрафные санкции за невыполнение указаний.

 

Для иллюстрации на приведенном простом примере биматричной игры продемонстрируем громоздкость алгоритма решения игры путем прямого перебора стратегий. Об аналогичной демонстрации решения игры даже страшно подумать!

Итак, в данном примере игрок 1 имеет в своем распоряжении 27= стратегий (по числу отображений множества, состоящего из трех точек в аналогичное множество). Приведем результаты применения каждой из этих стратегий.

В приведенной таблице первой строке соответствует выбор стратегии

 

Второй строке

 

В правых столбцах приведены выигрыши игроков при различных ответах игрока 2 на эти стратегии. Например, оптимальный ответ игрока 2 на стратегию 1 заключается в выборе третьего столбца. При этом реализуется исход (1,3) с выигрышами (2,7).

             
1.       (6,6) (0,0) (2,7)
2.       (6,6) (0,0) (3,0)
3.       (6,6) (0,0) (0,0)
4.       (6,6) (4,4) (2,7)
5.       (6,6) (4,4) (3,0)
6.       (6,6) (4,4) (0,0)
7.       (6,6) (0,3) (2,7)
8.       (6,6) (0,3) (3,0)
9.       (6,6) (0,3) (0,0)
10.       (0,0) (0,0) (2,7)
11.       (0,0) (0,0) (3,0)
12.       (0,0) (0,0) (0,0)
13.       (0,0) (4,4) (2,7)
14.       (0,0) (4,4) (3,0)
15.       (0,0) (4,4) (0,0)
16.       (0,0) (0,3) (2,7)
17.       (0,0) (0,3) (3,0)
18.       (0,0) (0,3) (0,0)
19.       (7,2) (0,0) (2,7)
20.       (7,2) (0,0) (3,0)
21.       (7,2) (0,0) (0,0)
22.       (7,2) (4,4) (2,7)
23.       (7,2) (4,4) (3,0)
24.       (7,2) (4,4) (0,0)
25.       (7,2) (0,3) (2,7)
26.       (7,2) (0,3) (3,0)
27.       (7,2) (0,3) (0,0)

Как видно из таблицы, оптимальными для игрока 1 являются стратегия 20 и стратегия 21, приводящие к исходу (3,1) с выигрышами (7,2).

Именно этот результат и был получен с помощью процедуры, не требующей перебора всех стратегий.

Проиллюстрируем работу предлагаемого алгоритма, когда множество управлений не является конечным.




Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 825; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.