КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Контекстно - свободные грамматики
Синтаксический анализ Конечный автомат Регулярные языки Порождающая грамматика G=<N,T,P,S>, правила которой имеют вид: A®aB или C®b, где A,B,CÎN, a,bÎT называется регулярной (автоматной). Язык, порождаемый автоматной грамматикой, называется автоматным (регулярным), или языком с конечным числом состояний. Конечный автомат А=<V,Q,d,q0,F>, где V={a1,a2,..,am} - входной алфавит; Q={q0,q1,...,qn-1} - алфавит состояний; d: Q´V®Q - функция переходов; q0ÎQ - начальное состояние; FÍQ - множество заключительных состояний. На ленте слово из V. Устройство чтения находится в начальном состоянии против первого символа. Устройство чтения за один такт перемещается на одну позицию вправо и изменяет свое состояние в соответствии с функцией перехода. Если пара (qi,aj), характеризующая состояние автомата, не является левой частью функции переходов, то автомат останавливается. Цепочка допускается конечным автоматом, если устройство чтения прочитывает последний символ и оказывается в одном из заключительных состояний. Автоматная грамматика Û Конечный автомат Пусть задана регулярная грамматика G=<N,T,P,S>, с правилами вида A®aB или C®b. Конечный автомат A=<V,Q,d,q0,F> допускает язык, порождаемый G, если 1). V=T; 2). Q=NÈ{Z}, где ZÏN, ZÏT; 3). q0=S; 4). F={Z}; 5). Отображение d: для правил вида A®aB команда (A,a) ®B, для правил вида C®b команда (C,b) ®Z Продукции имеют вид А®b, где А - нетерминал, bÎV*=(TUN)*. Вывод неоднозначен, поэтому вводят термин «левосторонний» («правосторонний») - вывод, когда правило вывода применяется к самому левому (правому) вхождению нетерминального символа. Пример 1. G=<N,T,P,S>, где N={E}, T={i,+,*}, S=E, P={E®E+E |E*E |i}, i - идентификатор. Эта грамматика порождает арифметические выражения без скобок с операциями сложения и умножения. Цепочка i+i*i может быть выведена так (левосторонний вывод): E®E+E®i+E®i+E*E®i+i*E®i+i*i; a). E®E*E®E+E*E®i+E*E®i+i*E®i+i*i; b). Удобнее представлять вывод с помощью дерева синтаксического разбора:
КС-грамматика называется неоднозначной, если для некоторой цепочки существует несколько деревьев синтаксического разбора. Пример 2. G=<N,T,P,S>, где N={E,R,F}, T={i,+,*,(,)}, S=E, P={E®E+R | R, R®R*F |F, F®(E) |i}, i - идентификатор. Единственный левосторонний вывод цепочки i+i*i и единственное дерево синтаксического разбора: c).
Имеется математический аппарат преобразования КС-грамматик, сохраняющий способность порождать тот же язык, что и исходная грамматика. Прежде чем строить распознающий алгоритм, КС-грамматику преобразуют, добиваясь необходимых свойств. КС-грамматика имеет нормальную форму Грейбах, если все порождающие правила в ней имеют вид А®ba, где А - нетерминал, b - терминал, aÎN*.
Дата добавления: 2013-12-13; Просмотров: 515; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |