Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Формальные языки и грамматики. Основные термины и определения

Алфавит – конечное непустое множество символов.

Термин символ следует понимать здесь в самом широком смысле слова. Символом можно считать любой знак или совокупность знаков, рассматриваемую как нечто неделимое (буква, цифра, знак препинания, служебное слово, иероглиф и т.д.).

Будем обозначать алфавит символом (sigma). Т.к. алфавит – это множество, поэтому при перечислении его элементов используются фигурные скобки.

Примеры алфавитов:

Под подразумевается алфавит языка Паскаль.

Цепочка над алфавитом - произвольная конечная последовательность символов из .

Примеры цепочек над алфавитом :

Цепочки будем обозначать греческими буквами.

Характеристикой цепочки является ее длина. Длиной цепочки называется число символов, образующих цепочку. Длина цепочки равна 9 и обозначается |

Пустая цепочка – цепочка, не содержащая символов (содержащая ноль символов). Обозначается буквой (epsilon).

Если и цепочки, то запись означает их конкатенацию (слияние).

Если - цепочка, то запись означает цепочку, образованную n-кратным повторением цепочки :

 

n-раз

Будем обозначать

- бесконечное множество всех цепочек над алфавитом , включая пустую цепочку,

- множество всех цепочек над алфавитом , не включая пустой цепочки.

Например, если , представляет собой множество всех цепочек, которые могут быть составлены из символов 0 и 1, включая пустую цепочку:

Языком над алфавитом называется произвольное множество цепочек, составленных из символов .

Принадлежащие языку цепочки называют также предложениями языка.

Отметим, что множество цепочек всегда бесконечно, в то время как множество цепочек, образующих язык может быть конечным.

 

5 Порождающие грамматики (Грамматики Н.Хомского [1])

 

Порождающие грамматики – мощный механизм, позволяющий задавать множество правил вывода, порождающих цепочки над , принадлежащие языку L.

Порождающей грамматикой называется четверка:

G=(T, N, P, S)

Где

Т – конечное множество терминальных (основных) символов- основной алфавит. Элементами множества Т являются символы, из которых в конечном итоге и состоят цепочки языка, порождаемые грамматикой. Т – это не что иное, как алфавит языка, порождаемого грамматикой. В дальнейшем терминалы будем обозначать малыми латинскими буквами a, b, c,.. и. т.д;

N - конечное множество нетерминальных (вспомогательных) символов – вспомогательный алфавит. Нетерминалы – это понятия грамматики (языка), которые используются при его описании. Нетерминалы будем обозначать заглавными латинскими буквами A, B, C, …;

Р – конечное множество правил вывода, называемых также продукциями. Каждое правило множества имеет вид: , ( символ «®» читается как «это есть» )

где и - цепочки терминальных и нетерминальных символов. Цепочка не должна быть пустой, цепочка может быть пуста: ; . Правило вывода определяет возможность подстановки вместо в процессе вывода (порождения) цепочек языка;

S (S Î N) - начальный символ грамматики – один из множества нетерминальных символов, начальный нетерминал. Начальный нетерминал – это понятие грамматики, соответствующее правильному предложению языка.

<== предыдущая лекция | следующая лекция ==>
Форма Бэкуса-Наура (БНФ) | Автоматные грамматики и конечные автоматы
Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 497; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.