Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Виды кодировок кириллицы

Кодировка латинского алфавита и кириллицы

Система числового кодирования компьютерных символов построена следующим образом.

1. Каждому символу, обозначенному на клавиатуре компьютера, присваивается двоичный восьмиразрядный код. Последовательность символов и их кодов формируется в кодировочную таблицу в порядке возрастания чисел и алфавитном порядке расположения букв. Кодировочная таблица компьютерных символов впервые была создана в США под названием ASCII (American Standard Code for Information Interchange) – американский стандартный код для обмена информацией[19]. Позже таблица ASCII-кодов была признана в качестве международного стандарта всеми странами, участвующими в глобальных информационных процессах. Иногда кодировочную таблицу упрощенно называют аски-код.

2. В таблице ASCII все кодируемые символы делятся на две группы, в первую из которых включается 128 символов (от 0 до 127) стандартного или неизменяемого кода, а во вторую – следующие 128 символов (от 128 до 255), которые относятся к расширяемой или изменяемой части кода (табл.8.2).

3. В первой стандартной группе кодируются буквы латинского алфавита, арабские цифры, математические знаки, знаки препинания и др. Кодировка первой группы символов является международной и обязательной для всех компьютеров, участвующих в процессе глобального обмена информацией.


Таблица 8.2

Представление символов в кодовой таблице ASCII

I половина - 128 символов (0-127) II половина - 128 символов (128-255)
управляющие коды Национальный алфавит. В России, Украине, Белоруссии, Сербии, Болгарии - кириллица
латинский алфавит (26 букв)
арабские цифры
математические знаки
знаки препинания

 

4. Вторая группа из 128 символов предоставлена для кодирования национальных алфавитов. Национальный алфавит русского языка (а также украинского, белорусского, болгарского) известен всему миру под названием кириллица.

Кириллица как славянская азбука была создана братьями Кириллом и Мефодием. Позже азбука была реформирована Петром I, реформированная кириллица служит до нашего времени. С появлением компьютеров кириллица была закодирована, исторически сложилось 6 способов кодировки кириллицы, различные версии кодировки появлялись одна за другой в процессе развития компьютерной техники. Со временем некоторые кодировки исчезли из употребления, к действующим в настоящее время относятся 4 кодировки.

1. CP1251 (Windows-кодировка) – создана для работы под операционной системой Windows.

2. KOI-8r – используется для представления русских текстов в сети Интернет.

3. ISO-8859 - кодировка кириллических текстов на основе международного стандарта, на территории России встречается редко.

4. Unicode – сравнительно новая международная 4-х байтовая кодировка, которая отличается от предыдущих 1-байтовых версий широкими количественными возможностями и может использоваться для кодирования всех языков на планете Земля, в том числе, славянской азбуки кириллицы.

Наличие многих кодировок кириллицы иногда создает трудности по переходу из одной кодировки в другую. Для перехода между кодировками используются специальные программы, которые называются текстовыми конверторами. Современные конверторы способны самостоятельно определять исходную кодировку текста, расшифровывать текст и представлять его на естественном языке.

<== предыдущая лекция | следующая лекция ==>
Способы кодирования текста | Операции текстовой обработки
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 8761; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.