Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Игры с природой




В рассмотренных ранее задачах соперником игрока А был другой «мыслящий» игрок В. Однако часто таким «соперником» может быть некоторое стечение обстоятельств, неконтролируемое человеком. Выбор стратегии стороной В происходит случайно, совершенно не рассматривая, выгодно это А или нет. Такие ситуации называются играми с природой.
Предположим, что игрок А имеет п альтернатив решения ситуации, которые обозначим . Результат выбора (выигрыш А) зависит от того, как будит развиваться ситуация, на которую этот игрок повлиять ни как не может. Предположим, что возможны m вариантов развития ситуации, которые обозначим . Данные варианты в теории игр называют «Состояниями природы», т.к. в большинстве реальные задачи этого типа связаны с погодными, климатическими, социальными и другими стихийными явлениями.
Допустим, что известен результат для игрока А (выраженный количественно) при каждой альтернатива Ai и развитии ситуации Bj. Обозначим его . Получаем матрицу , которую называют матрицей выигрышей или матрицей потерь, в зависимости от того, максимизируется или минимизируется результат для игрока А.
В соответствии с реальными условиями, существует несколько критериев принятия решений в условиях неопределенности. Для более наглядного описания этих методов, рассмотрим их на примерах. Изучим сначала критерии максимизации результата, когда показатели привлекательности чем больше, тем лучше для А.
ПРИМЕР 1.
Директор торговой фирмы, продающей телевизоры марки «Zarya» решил открыть представительство в областном центре. У него имеются альтернативы либо создавать собственный магазин в отдельном помещении, либо организовывать сотрудничество с местными торговыми центрами. Всего можно выделить 5 альтернатив решения: Успех торговой фирмы зависит от того, как сложится ситуация на рынке предоставляемых услуг. Эксперты выделяют 4 возможных варианта развития ситуации Прибыль фирмы для каждой альтернативы при каждой ситуации представлена матрицей выигрышей (млн. р./год).

  B 1 B 2 B 3 B 4
А 1        
А 2        
А 3        
А 4        
А 5        


Рассмотрим основные критерии, позволяющие выбирать оптимальную альтернативу для принятия решения.
1) Критерий Лапласа.
Он основан на предположении, что каждый вариант развития ситуации (состояния «природы») равновероятен. Поэтому, для принятия решения, необходимо рассчитать функцию полезности для каждой альтернативы, равную среднеарифметическому показателей привлекательности по каждому «состоянию природы»:
.
Выбирается та альтернатива, для которой функция полезности максимальна. Для примера:

Видно, что функция полезности максимальна для альтернативы А5, следовательно ее рациональнее всего принять.
2) Критерий Вальда.
Данный критерий основывается на принципе максимального пессимизма, то есть на предположении, что скорее всего произойдет наиболее худший вариант развития ситуации и риск наихудшего варианта нужно свести к минимуму. Для применения критерия нужно для каждой альтернативы выбрать наихудший показатель привлекательности (наименьшее число в каждой строке матрицы выигрышей) и выбрать ту альтернативу, для которой этот показатель максимальный. Для нашего примера: Видно, что наилучшим из наихудших показателей обладает альтернатива А 2, для нее наибольшее.
3) Критерий максимального оптимизма.
Наиболее простой критерий, основывающийся на идее, что ЛПР, имея возможность в некоторой степени управлять ситуацией, рассчитывает, что произойдет такое развитие ситуации, которое для него является наиболее выгодным. В соответствии с критерием принимается альтернатива, соответствующая максимальному элементу матрицы выигрышей. Для приведенного примера эта величина , поэтому выбираем альтернативу .
4) Критерий Сэвиджа.
Он основан на принципе минимизации потерь, связанных с тем, что игрок А принял не оптимальное решение. Для решения задачи составляется матрица потерь, которая называется матрицей рисков , которая получается из матрицы выигрышей путем вычитания из максимального элемента каждого столбца всех остальных элементов. В рассматриваемом примере эта матрица есть:

  B 1 B 2 B 3 B 4
А 1        
А 2        
А 3        
А 4        
А 5        


Далее, для каждой альтернативы определяем величины , равные максимальному риску (наибольшее число в каждой строке матрицы рисков) и выбирают ту альтернативу, для которой максимальный риск минимален. В нашем примере: минимально Принимаем альтернативу А 2.
5) Критерий Гурвица.
Это самый универсальный критерий, который позволяет управлять степенью «оптимизма - пессимизма» игрока А. Введем некоторый коэффициент a, который назовем коэффициентом доверия или коэффициентом оптимизма. Этот коэффициент можно интерпретировать как вероятность, с которой произойдет наилучший для А исход. Исходя из этого, наихудший вариант можно ожидать с вероятностью (1-α). Коэффициент доверия a показывает, насколько игрок А может управлять ситуацией и в той или иной степени рассчитывает на благоприятный для него исход. Если вероятности благоприятной и неблагоприятной ситуации для А равны, то следует принять α=0,5.
Для реализации критерия определяются наилучшие и наихудшие значение каждой альтернативе по формулам , . Далее, вычисляются функции полезности по формуле:
.
Выбирается та альтернатива, для которой функция полезности максимальна.
Предположим, что для нашего примера игрок А достаточно уверен в положительном результате и оценивает вероятность максимального успеха в α=0,7. Тогда:

В соответствии с расчетами игроку А следует выбрать альтернативу А 3. Если же, например, А не очень уверен в положительном исходе и расценивает его вероятность порядка α=0,2, то функции полезности равны:

Видно, что в этом случае следует принять А 2, для которого функция полезности максимальна.
Следует отметить, что при α=0, критерий Гурвица переходит в пессимистический критерий Вальда, а при α=1 – в критерий максимального оптимизма.
В случае, если показатель привлекательности по критерию минимизируются (чем меньше, тем лучше для А, например затраты, риск и др.), то критерии принятия оптимального решения несколько меняются. Рассмотрим эти отличия.
Критерий Лапласа определяет оптимальное решение по минимальной функции полезности. Применяя критерий Вальда необходимо вычислять максимальный показатель каждой альтернативы (строки) и принимать альтернативу, где этот показатель минимален. Критерий максимального оптимизма позволяет определить оптимальное решение, соответствующее минимальному элементу матрицы выигрышей (которую в случае минимизации часто называют матрицей потерь). Матрица рисков в критерии Сэвиджа получается в результате вычитания из каждого элемента матрицы потерь минимального элемента каждого столбца . Для реализации критерия Гурвица вычисляются максимальные и минимальные показатели для каждой альтернативы , и функции полезности рассчитываются по формуле: . Выбирается альтернатива с наименьшей функцией полезности. Рассмотрим пример.
ПРИМЕР 2. Нефтяная компания собирается построить в районе крайнего севера нефтяную вышку. Имеется 4 проекта A, B, C и D. Затраты на строительство (млн. руб.) зависят от того, какие погодные условия будут в период строительства. Возможны 5 вариантов погоды . Выбрать оптимальный проект для строительства используя критерии Лапласа, Вальда, максимального оптимизма, Сэвиджа и Гурвица при . Матрица затрат имеет вид:

  S 1 S 2 S 3 S 4 S 5
A 1          
A 2          
A 3          
A 4          


Критерий Лапласа.

Следует выбрать альтернативу А1.
Критерий Вальда: среди наихудших вариантов α1=12, α2=10, α3=15, α4=11, наилучший соответствует α2=10, следовательно принимаем альтернативу А2.
Критерий максимального оптимизма. Соответствует альтернативе, для которой минимальное.
Критерии Сэвиджа имеет матрицу рисков:

  S 1 S 2 S 3 S 4 S 5
A 1          
A 2          
A 3          
A 4          


Максимальные элементы для каждого критерия матрицы рисков равны: β1=4; β2=4; β3=8; β4=3. Принимаем альтернативу, соответствующую минимальному значению β4=3, то есть А4.
В соответствии с критерии Гурвица на уровне , функции полезности равны:

Принимаем альтернативу А 2 с наименьшей функцией полезности .




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 1670; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.