Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Минимаксный принцип поиска решений




Алгоритмы поиска пути на И/ИЛИ- графах могут использовать стратегии поиска в глубину и ширину, однако, для большинства игр, дерево игры имеет большое количество позиций, что приводит к комбинаторному взрыву при реализации просмотра всех вершин дерева решений.

Основной подход к организации поиска на игровых деревьях использует оценочные функции. Оценочная функция используется для вычисления оценки текущего состояния игры.

Для выбора следующего хода используется простой алгоритм:

· найти всевозможные состояния игры, которые могут быть достигнуты за один ход;

· используя оценочную функцию, вычислить оценки состояний;

· выбрать ход, ведущий к позиции с наивысшей оценкой.

Если оценочная функция была бы совершенной, то есть ее значение отражало бы какие позиции ведут к победе, а какие – к поражению, то достаточно было бы просмотра вперед на один шаг. Обычно совершенная оценочная функция неизвестна, поэтому стратегия выбора хода на основе просмотра на один шаг вперед не дает хорошего результата, поэтому используется стратегия просмотра на несколько шагов вперед.

Станодартный метод определения оценки позиции, основанный на просмотре вперед нескольких слоев игрового дерева, назывыается минимаксным алгоритмом.

Минимаксный алгоритм предполагает, что противник из нескольких возможных ходов сделает выбор, лучший для себя, то есть худший для игрока. Поэтому целью игрока является выбор такого хода, который даст максимальную оценку позиции, возможной после лучшего хода противника, то есть минимизирующего оценку позиции противника. Отсюда название – минимаксный алгоритм. Число слоев игрового дерева, просматриваемых при поиске, зависит от доступных ресурсов. На последнем слое используется оценочная функция.

В предположении, что оценочная функция выбрана разумно, алгоритм будет давать тем лучшие результаты, чем больше слоев просматривается при поиске.

Пусть мы имеем следующее дерево игры:

a
игрок
c

 

 


t8

 

 


Задана некая оценочная функция j(Pk), где Pk- некоторая игровая ситуация.

Предположим, что игрок максимизирует свой выигрыш, а противник минимизирует свой проигрыш. Вариант решения, образованный минимаксной стратегией движения по дереву игры, будем называть основным вариантом решения.

Если существует оценочная функция, то можно ввести внутреннюю функцию j(Pk) такую, что:

j(pk)=

trace

domains

pozic = symbol

spoz = pozic*

database

xod (pozic, spoz)

xod_min (pozic)

xod_max (pozic)

predicates

minmax (pozic, pozic, integer)

best (spoz, pozic, integer)

oc_term(pozic, integer)

vibor(pozic, integer, pozic, integer, pozic, integer)

clauses

xod (a, [b,c]).

xod (b, [d,e]).

xod (c, [f,g]).

xod (d, [t1,t2]).

xod (e, [t3,t4]).

xod (f, [t5,t6]).

xod (g, [t7,t8]).

xod_max (a).

xod_max (d).

xod_max (e).

xod_max (f).

xod_max (g).

xod_min (b).

xod_min (c).

xod_min (t1).

xod_min (t2).

xod_min (t3).

xod_min (t4).

xod_min (t5).

xod_min (t6).

xod_min (t7).

xod_min (t8).

oc_term (a,4).

oc_term (b,4).

oc_term (c,1).

oc_term (d,4).

oc_term (e,6).

oc_term (f,2).

oc_term (g,1).

oc_term (t1,1).

oc_term (t2,4).

oc_term (t3,5).

oc_term (t4,6).

oc_term (t5,2).

oc_term (t6,1).

oc_term (t7,1).

oc_term (t8,1).

minmax (Poz, BestPoz, Oc):-

xod (Poz, SpPoz),!,

best(SpPoz, BestPoz, Oc);

oc_term(Poz, Oc).

best ([Poz], Poz, Oc):- minmax (Poz, _, Oc),!.

best ([Poz1| T], BestPoz, BestOc):-

minmax (Poz1, _, Oc1),

best (T, Poz2, Oc2),

vibor(Poz1,Oc1,Poz2,Oc2,BestPoz,BestOc).

vibor(Poz0, Oc0, Poz1, Oc1, Poz0, Oc0):-

xod_min (Poz0), Oc0>Oc1,!;

xod_max (Poz0), Oc0<Oc1,!.

vibor(Poz0, Oc0, Poz1, Oc1, Poz1, Oc1).

goal

minmax(a,BestPoz,Oc),write(BestPoz),write(Oc).

 

 





Поделиться с друзьями:


Дата добавления: 2015-06-27; Просмотров: 437; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.