КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Регулярные выражения
Пример 3 Пусть L – множество (A,B,…,Z,a,b,…,z), а М – множество (0,1,2,…,9). Можно рассматривать множества L и М двояко. С одной стороны, L представляет собой алфавит, состоящий из набора прописных и строчных букв, а М – алфавит, состоящий из цифр. С другой стороны, поскольку символ можно рассматривать как строку единичной длины, множества L и М представляет собой конечные языки. Вот несколько примеров новых языков, созданных из L и М с применением операторов, приведенных на рис. 3.8. 1. L М представляет собой множество букв и цифр. 2. LМ – множество строк, состоящих из букв, за которой следует цифра. 3. L4 – множество всех четырехбуквенных строк. 4. L* - множество всех строк из букв, включая пустую строку ε. 5. L(L М)* - множество всех строк из букв и цифр, начинающихся с буквы. 6. М+ - множество всех строк из одной или нескольких цифр. Множество, определенное в п.5 примера 3, описывает идентификаторы языка Pascal и представляет собой букву, за которой следует нуль или несколько букв или цифр. Представленный способ записи называется регулярным выражением, который позволяет точно определять подобные множества. С помощью этого способа записи можно определить идентификаторы Pascal как letter (letter│digit) * Вертикальная черта означает “или”, скобки используются для группирования подвыражений, а непосредственное соседство letter с оставшейся частью выражения означает конкатенацию. Регулярное выражение строится из более простых регулярных выражений с использованием набора правил. Каждое регулярное выражение r обозначает, или задает язык L(r). Правила, которые определяют регулярные выражения над алфавитом А. 1. λ (или ε) представляет собой регулярное выражение, обозначающее { λ }, т.е. множество, содержащее пустую строку.
2. Если a является символом из А, то a – регулярное выражение, обозначающее { а }, т.е. множество, содержащее строку а. Хотя мы используем одну и туже запись, технически регулярное выражение а отличается от строки а. О чем идет речь, о регулярном выражении, строке или символе – становится понятно из контекста. 3. Если r и s – регулярные выражения, обозначающие языки L(r) и L(s), тогда · (r)│(s) представляет собой регулярное выражение, обозначающее L(r) L(s). · (r)(s) – регулярное выражение, обозначающее L(r) и L(s). · (r)* – регулярное выражение, обозначающее (L(r))*. · (r) - регулярное выражение, обозначающее L(r). Язык, задаваемый регулярным выражением, называется регулярным множеством. Лишние скобки в регулярном выражении может быть устранены, если принять следующие соглашения. 1. Унарный оператор * имеет высший приоритет и левоассоциативен. 2. Конкатенация имеет второй по значимости приоритет и левоассоциативна. 3. │(объединение) имеет низший приоритет и левоассоциативно. При этих соглашениях запись (а)│((b)*(c)) эквивалентна а │ b * c. Оба выражения обозначают множества строк, которые представляют собой либо единичный а, либо нуль или несколько b, за которыми следует единственный с [3].
Дата добавления: 2014-12-27; Просмотров: 789; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |