Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Кодирование символьной (текстовой) информации




 

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например, символ "§".

Символьная (алфавитно-цифровая) информация хранится и обрабатывается в ЭВМ в форме цифрового кода, т.е. каждому символу ставится в соответствие отдельный код.

Среди наборов символов наибольшее распространение получили знаки кода ASCII (American Standard Code for Information Interchange) – американский стандартный код обмена информацией, который состоит из двух таблиц кодирования: базовой и расширенной. Базовая таблица закрепляет коды от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков и соответственно эти коды не выводятся ни на экран, ни на устройство печати, но они могут управлять тем, как производится вывод прочих данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и вспомогательных символов.

В расширенной таблице стандартной кодировки фирмы IBM три смежные колонки (коды 176…223) занимают символы псевдографики, колонки с кодами от 128 до 175 и от 224 до 239 используются для размещения символов национальных алфавитов, а последняя колонка (коды 249…255) – для размещения специальных знаков.

Для представления букв русского алфавита в рамках ASCII применяется так называемая ГОСТ-альтернативная кодировка (табл. 4), главное достоинство которой – расположение символов псевдографики на тех же местах, что и в кодировке IBM. Расположение символов в этой облегчает использование зарубежного программного обеспечения на отечественных ЭВМ.

В связи с массовым распространением операционных систем и других продуктов компании Microsoft в нашей стране нашла применение кодировка символов русского языка, известная как Windows -1251. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows.

Таблица 4

ГОСТ-альтернативная кодировка

  А   Р   а         Р   Ё
  Б   С   б         С   ё
  В   Т   в         т   Є
  Г   У   г         у   є
  Д   Ф   д         ф   Ї
  Е   Х   е         х   ї
  Ж   Ц   ж         ц   Ў
  З   Ч   з         ч   ў
  И   Ш   и         ш   °
  Й   Щ   й         щ  
  К   Ъ   к         ъ   ·
  Л   Ы   л         ы    
  М   Ь   м         ь  
  Н   Э   н         э   ¤
  О   Ю   о         ю  
  П   Я   п         я    

Другая распространенная кодировка носит название КОИ-8 (код обмена информации восьмизначный). Кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в некоторых службах российского сектора Интернета, в частности, в сообщениях электронной почты и телеконференций.

В таблице ASCII базовая часть (символы с кодами от 0 до 127 включительно) является основной, в соответствии с принятым стандартом она не может изменена. Расширенная часть (символы с кодами от 128 до 255) отдана национальным алфавитам и в соответствии с утвержденными стандартами эта часть таблицы изменяется в зависимости от национального алфавита той страны, где она используется, и способа кодирования.

Во многих странах Азии 256 кодов явно не хватило для кодирования их национальных алфавитов. Поэтому производители программных продуктов и организации, утверждающие стандарты. пришли к соглашению о выработке единого стандарта. Это стандарт построен по 16 битной схеме и получил название UNICODE. Он позволяет закодировать 216=65536 символов, которых достаточно для кодирования всех национальных алфавитов в одной таблице. Так как каждый символ этой кодировки занимает два байта (вместо одного, как раньше), все текстовые документы, представленные в UNICODE, стали длиннее в два раза.




Поделиться с друзьями:


Дата добавления: 2015-05-10; Просмотров: 1325; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.