Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Управление ИСУ при неточном знании параметров подсистем

Лекция 10

Пример

Дано:

 

 

при 0 i

Для этой игры определим минимаксные выигрыши:

 

 

 

 

Введём стратегии наказания:

 

Множество – взаимовыгодное множество, при выборе управления из этого множества игроки получают выигрыш, не меньший, чем их минимаксный результат.

В данном случае

Построим множество.

 

 
Множество X - многоугольник ABC Множество - многоугольник EFC c координатами

Е, F, С,

Теперь построим эти множества в пространстве критериев.

Определим координаты этих множеств:

 

 

 

 

 

 

 

Отрезок - множество Парето.

Найдём моменты наблюдений для точки, которая принадлежитмножеству Парето и является исходом равновесногй ситуации на стратегиях:

 

 

 

В данном примере

 

 

 

Вычислим параметры:

 

 

Первого игрока проверять не надо - ему невыгодно отклоняться от договорной точки, в которой его функция выигрыша равна глобальному максимуму:

 

Первая проверка второго игрока должна происходить в момент времени:

 

Вторая проверка:

 

Литература

1. Ю.Б. Гермейер «Игры с непротивоположными интересами». Изд-во «Наука». Москва. 1976.

2. Кононенко А.Ф. Постановка задачи. Модель с непрерывным временем. //Соврем. состояние теории исследования операций: М.: Наука, 1979.с.173-179.

3. Кононенко А.Ф. О задаче наблюдения в повторяющихся операциях // Соврем. состояние теории исследования операций: М.: Наука, 1979.с.179-182.

 


Как уже было отмечено, для решения вопроса о целесообразности построения иерархической системы управления (ИСУ) необходимо сравнить максимальный гарантированный результат (МГР) центра при централизованном и (частично) децентрализованном способах управления. При этом учитывается влияние неопределённых факторов. Для этого будем считать, что выигрыш центра определяется функцией, где – управляющие параметры центра; удовлетворяющие ограничениям, а - неопределённый параметр, про который центру известно только, что.

Тогда, следуя принципу МГР, центр оценивает свой выигрыш величиной

 

При децентрализованном способе управления центр передаёт нижнему уровню право выбора параметра. Пусть обмен информацией (в том числе и о величине) между уровнями приводит к усложнению класса стратегий
.

Основываясь на предположении о рациональном поведении элементов нижнего уровня, центр может построить множество откликов на свою стратегию. В этом случае принцип МГР позволяет оценить выигрыш центра величиной:

 

В случае полной информированности всегда имеет место неравенство.

Однако в более реальном случае наличия неопределённости возможны любые из трёх соотношений:,,.

Выполнение какого-либо одного из них определяется, во-первых, самой моделируемой ситуацией (функцией, множествами и, во-вторых, тем насколько удачен выбор процедур обмена информацией (множествами).

В отличие от традиционных постановок задач принятия решений в условиях неопределённости будем изучать вопросы выбора рациональных решений в условиях наличия неопределённости, которую назовём субъективной.

Субъективная неопределённость характеризуется тем, что во-первых подсистемы имеют различную информированность о неопределённых факторах: о параметрах системы и её элементов, о влиянии на систему внешней среды, и во-вторых учитывается возможность и целесообразность обмена информацией о действиях элементов(т.е. о выборе ими управлений),о параметрах, описывающих влияние внешней среды.

Обмен информацией производится только в своих интересах, следовательно, не исключается возможность отказа от сообщения какой-либо информации или сообщения ложной информации.

Замечание 1. Обмен информацией о неточно известных параметрах формализуется, как дополнительный элемент стратегии, то есть приводит к расширению самого понятия стратегии. Целесообразность такого расширения проиллюстрируем на следующем простом примере иерархической игры.

Пример. Пусть выигрыш игрока 1 (центра) описывается функцией, множества выборов игроков имеют вид

 

 

Функция выигрыша игрока 2 (подчиненного) неизвестно игроку 1, который только знает, что она равна одной из двух функций

 

 

Таким образом с точки зрения игрока 1:

,,

Истинное значение или не известно игроку 1, но известно игроку 2.

В описанных условиях на классе стратегий игрок 1 не может получить гарантированно глобальный максимум

при,.

Действительно, при, игроку 1 одинаково выгодно выбирать или. Однако игрок 2 при одном из этих выборов может получить глобальный минимум. Следовательно, выбору он предпочтёт выбор. Поэтому в данном случае обоим игрокам выгоден обмен информацией, о том какую именно функцию максимизирует игрок 2. Рассчитывая на получение такой информации (обозначим её через τ), игрок 1 выберет и сообщит игроку 2 стратегию

 

которая вместе с выбором игрока 2 и при сообщении им истинной информации о своей функции выигрыша игроку 1, гарантирует обоим игрокам получение глобального максимума.

 

Далее предполагается, что игрок 2 может сообщить игроку 1 любое значение (не обязательно).Если он не сообщает такой информации, то игрок 1 формально, по своему усмотрению, присваивает этой величине какое-то значение из множества.

Итак, будем считать что,,то есть игрок 1 до выбора будет знать точную информацию о и какую-то информацию о.

Итак, рассмотрим игру

,

Где, как и ранее, проекция:,

 

Введём некоторые обозначения

 

 

 

 

 

 

Стратегия наказания:

 

Далее будем считать, что выполняются следующие условия:

Знание игроком 1 множества не противоречит объективному описанию модели, т.е. истинное значение неопределённого параметра принадлежит этому множеству

Подчинённый (игрок 2) доброжелателен к начальнику - центру (игроку 1). Это условие, как и ранее, можно заменить условиями, справедливыми при всех

- множества

 

-замыкание множества

.

Стратегия наказания не зависит от параметра:.

Построим стратегию

 

В этой стратегии наказание реализуется, если игрок 2 не сообщил информацию о неопределённом параметре, т.е. или, сообщив информацию выбрал.

Замечание 2. Независимость стратегии наказания от неопределённого параметра не является жёстким ограничением для экономических моделей. Наказание - это выбор минимального значения цены и поощрения, либо максимального штрафа и т.д.

Замечание 3. Как и ранее, предполагаем, что максимумы и минимумы в соответствующих выражениях достигаются.

Теорема. В сформулированных условиях МГР игрока 1 равен

 

и достигается путём выбора игроком 1 оптимальной стратегии

Доказательство. Игрок 2 может выбрать лучшую для себя пару, т.е. его выигрыш оценивается величиной

 

Если же игрок 2 ослушается начальника-игрока 1,то при любом

 

В силу доброжелательности или, как часто бывает, в силу строгого неравенства

 

Игрок 2 с гарантией для игрока 1 выберет наилучшую для себя пару что, в свою очередь гарантирует игроку 1 выигрыш

 

Итак, результат гарантируется игроку 1. На больший результат он рассчитывать не может, так как при известном может получить не больше и, рассчитывая на худшее для себя он не может ожидать выигрыша более чем

 

Теорема доказана.

 

<== предыдущая лекция | следующая лекция ==>
Динамическая модель принятия решений с непрерывным временем | Экономные процедуры обмена информацией
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 209; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.023 сек.