КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Кодирование символьной (текстовой) информации
Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например, символ "§". Символьная (алфавитно-цифровая) информация хранится и обрабатывается в ЭВМ в форме цифрового кода, т.е. каждому символу ставится в соответствие отдельный код. Среди наборов символов наибольшее распространение получили знаки кода ASCII (American Standard Code for Information Interchange) – американский стандартный код обмена информацией, который состоит из двух таблиц кодирования: базовой и расширенной. Базовая таблица закрепляет коды от 0 до 127, а расширенная относится к символам с номерами от 128 до 255. Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков и соответственно эти коды не выводятся ни на экран, ни на устройство печати, но они могут управлять тем, как производится вывод прочих данных. Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и вспомогательных символов. В расширенной таблице стандартной кодировки фирмы IBM три смежные колонки (коды 176…223) занимают символы псевдографики, колонки с кодами от 128 до 175 и от 224 до 239 используются для размещения символов национальных алфавитов, а последняя колонка (коды 249…255) – для размещения специальных знаков. Для представления букв русского алфавита в рамках ASCII применяется так называемая ГОСТ-альтернативная кодировка (табл. 4), главное достоинство которой – расположение символов псевдографики на тех же местах, что и в кодировке IBM. Расположение символов в этой облегчает использование зарубежного программного обеспечения на отечественных ЭВМ. В связи с массовым распространением операционных систем и других продуктов компании Microsoft в нашей стране нашла применение кодировка символов русского языка, известная как Windows -1251. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows. Таблица 4 ГОСТ-альтернативная кодировка
Другая распространенная кодировка носит название КОИ-8 (код обмена информации восьмизначный). Кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в некоторых службах российского сектора Интернета, в частности, в сообщениях электронной почты и телеконференций. В таблице ASCII базовая часть (символы с кодами от 0 до 127 включительно) является основной, в соответствии с принятым стандартом она не может изменена. Расширенная часть (символы с кодами от 128 до 255) отдана национальным алфавитам и в соответствии с утвержденными стандартами эта часть таблицы изменяется в зависимости от национального алфавита той страны, где она используется, и способа кодирования. Во многих странах Азии 256 кодов явно не хватило для кодирования их национальных алфавитов. Поэтому производители программных продуктов и организации, утверждающие стандарты. пришли к соглашению о выработке единого стандарта. Это стандарт построен по 16 битной схеме и получил название UNICODE. Он позволяет закодировать 216=65536 символов, которых достаточно для кодирования всех национальных алфавитов в одной таблице. Так как каждый символ этой кодировки занимает два байта (вместо одного, как раньше), все текстовые документы, представленные в UNICODE, стали длиннее в два раза.
Дата добавления: 2015-05-10; Просмотров: 1356; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |