КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Способы кодирования текста
Кодировка буквенных символов Лекция 8. Компьютерное представление текста Компьютерное представление текста связано с системой его кодирования, которая начала развиваться задолго до появления компьютера. В развитии системы кодирования текста можно отметить следующие особенности. 1. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована. Решать задачу кодирования информации человечество начало задолго до появления компьютеров. В результате решения этой грандиозной задачи была создана письменность – как система кодирования речи и арифметика - как система кодирования чисел. 2. Человек выражает свои мысли в виде предложений, составленных из слов. Слова, в свою очередь, складываются из букв. Буквы объединяются в алфавит. Основу языка составляет алфавит - конечный набор различных знаков (символов) любой природы, из которых складывается сообщение. 3. Одна и та же запись может нести разную смысловую нагрузку. Например, набор цифр 251299 может обозначать: массу объекта; длину объекта; расстояние между объектами; номер телефона; запись даты и т.д. Запись – это данные, которые могут превратиться в информацию только в результате раскодирования. Таким образом, для представления информации нужно знать систему кодирования и декодирования илиопределенные правила записи кодов. Кодирование – это процесс представления информации в виде кода, или переход от одного формата к другому, более удобному для хранения, передачи или обработки информации. Код – набор условных обозначений для представления информации. Декодирование – получение информации с использованием кода (обратное преобразование). Шифрование – кодирование, выполняемое с целью засекречивания сообщения, результат шифрования называется криптограммой или шифровкой. 4. Кодировать информацию можно различными способами: устно, письменно, жестами или сигналами любой другой природы (сигналы светофора, телефонные звонки). Чаще всего кодированию подвергаются тексты на естественных языках. Для естественных языков существуют различные способы кодирования, остановимся на самых характерных и широко используемых способах. 1. Графический – основан на использовании специальных рисунков или знаков. Графическое кодирование описано, например, в литературном произведении Конан Дойла "Пляшущие человечки", где для шифрования сообщений использовалась последовательность человеческих фигурок. Другим примером графического кодирования является азбука Морзе, созданная американским изобретателем Самюэлем Морзе[17] в 1837 году для телеграфического кодирования сообщений. В азбуке Морзе каждая буква или знак представлены комбинацией точек и тире или последовательностью коротких и длинных сигналов. До настоящего времени в мореходной практике используются сигналы азбуки Морзе, например, сигнал бедствия – SOS (спасите наши души). 2. Символьный – на основе символов (букв) того же алфавита, что и исходный текст. Способ используется, например, в криптографии при создании шифрованных сообщений. Одним из первых применений способа является кодирование английского алфавита, предложенное в 1580 году Фрэнсисом Бэконом[18]. Шифр Бэкона (табл. 8.1) выполнен на основе двоичного 5-тиразрядного кода или двухсимвольного алфавита, состоящего из букв А и В. Таблица 8.1 Кодирование английского алфавита
Для создания сообщений на основе предложенной Бэконом системы требуется двухсимвольный алфавит, но при этом длина самого сообщения возрастает в 5 раз, поскольку каждая буква заменяется набором из 5 символов. 3. Числовой – основан на кодировании символов с помощью чисел. Широкое распространение способ получил благодаря развитию ЭВМ. В ЭВМ для кодирования букв используется два числа: 0 и 1. В отличие от шифра Бэкона, где достаточно 5-разрядного представления, в компьютерной технике принято 8-разрядное или 8-битовое представление символов. Последовательность из 8 бит образует 1 байт, байт используется для кодирования одного символа. Число возможных комбинаций 0 и 1 в пределах байта вычисляется по формуле 28=256. Это означает, что с помощью одного байта путем смены последовательности записи нулей и единиц можно закодировать 256 различных символов. Числовую систему кодирования компьютерных символов следует рассматривать как систему общего пользования. При создании такой системы кодирования используются общеизвестные подходы и принципы. Рассмотрим, каким образом числовой способ реализуется для кодирования компьютерного текста.
Дата добавления: 2014-01-04; Просмотров: 9555; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |