КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Регулярное выражение
Преобразование текста Количество информации Битные кодовые страницы Битные кодовые страницы ASCII Кодирование текста Компьютерный текст и его изображение Компьютерный текст Операционные систмемы Компьютерный текст Шрифт Векторная графика Кодирование цвета - палитра Кодирование цвета – RGB n24-битный цвет –8 бит интенсивность красного –8 бит интенсивность зеленого –8 бит интенсивность синего nДисплей –800 x 600 пикселей –3 байта на пиксель –1 440 000 байт > 1Мбайт nИзображение составляется из графических элементов: прямых, ломаных, прямоугольников, овалов и т.п. nДля каждого элемента кодируются координаты контура, цвет и толщина линии, цвет заполнения. nПример – язык SVG (Scalable Vector Graphics)
n… - таблица, в которой коду символа соответствует рисунок символа nРастровый, векторный, контурный Следующая лекция – базы данных Вопросы?
#3 nТекст – буквы, слова, предложения nКомпьютерный текст – цепочка символов nСимволы – элементы конечного множества, включающего буквы, цифры, знаки, служебные символы –Пробел –НС nЧисло бит на символ –7 бит/символ – ASCII –8 бит/символ – ANSI, КОИ-8, CP866, CP1251 –16 бит/символ – UNICODE –8-24 бит/символ – UTF-8 nСоответствие между кодами и символами nAmerican Standard Code for Information Interchange n7 бит на символ – 128 символов –26*2 латинских буквы –10 цифр –32 знака –34 служебных символа nСтарший бит 0 – ASCII nСтарший бит 1 – кодовые страницы Большие кодовые таблицы nUNICODE: 16 бит/символ – 65535 символов nUTF-8: переменное число байт –Бит8=0: один байт (ASCII) –Бит8=1&Бит7=0: два байта (16384 символа UNICODE) –Бит8=1&Бит7=1: три байта (оставшиеся символы) nCP1251: 24 байта nUTF-8: 37 байт nUNICODE: 50 байт nАлгоритмы компрессии (WinZip, …) –Переменная длина кода –В множество «символов» помещают часто встречающиеся подцепочки (слова) nS: {s1,s2,…sn} – множество символов nt: {1,2.. k }®S – цепочка символов длиной k nT – множество всех цепочек (длины 0, 1, 2, …) –{ а, б, в, … я, аа, аб, ав, … мамамылараму …} nT®T – алгоритм преобразования текста nОбласть определения = язык nГрамматика языка – правила, порождающие все входящие в язык цепочки nПример –Грамматика: все цепочки, содержащие последовательность МАМА –Функция преобразования: замена всех вхождений МАМА на ПАПА n… - правило, порождающее множество текстов nЛюбой символ алфавита – регулярное выражение (порождает множество из одного текста длиной в один символ) nЕсли a и b – регулярные выражения, то регулярными выражениями являются – a | b («или», объединение множеств) – ab («конкатенация», прямое произведение множеств) –(a) – a* («повторение») nПримеры – (a | b) (a | b) порождает { aa, ab, ba, bb} – ((a | b) a)* порождает { aa, ba, aaaa, baaa, aaba, baba, aaaaaa, … } Порождаемые языки? n Б = a | б | в | г | … | ю | я –Другая запись [а-я] n С = Б | ББ | БББ | ББББ –Другая запись: [а-я]{1,4} n(С (¶ | □))* –Другая запись: ([а-я]{1,4}[ ])* Литература nРегулярные выражения –Т.Пратт, М.Зелковиц. Языки программирования. Разработка и реализация. М.: Питер, 2002 (ISBN 5-318-00189-0) Раздел 3.3.2 –А.В.Ахо, Р.Сети, Д.Д.Ульман. Компиляторы: принципы, технологии и инструменты. М.: Вильямс, 2003 (ISBN 5-8459-0189-8) Раздел 3.3
#2
Дата добавления: 2014-01-20; Просмотров: 249; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |