Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Текстовая информация. Виды компьютерной информации

Виды компьютерной информации

Для соотнесения объемов компьютерной информации с традиционными можно привести следующее соответствие: в 1 МБ можно хранить примерно 400 страниц неформатированного текста.

Для обработки нечисловой информации она должна быть закодирована или оцифрована, т. е. преобразована в числовую форму.

При хранении в компьютере любой текст рассматривается как линейная последовательность символов. Пробел, переход на следующую строку, переход на следующую страницу и т. д. рассматриваются как специальные символы. Каждому символу из этой последовательности ставится в соответствие конкретный двоичный код, состоящий из 8 двоичных разрядов. Таким образом, код каждого символа текста занимает один байт памяти. Следовательно, текст целиком занимает столько байт памяти машины, из скольких символов он состоит, включая все символы текста – пробелы, знаки препинания, знаки переходов и т. д.

Списки всех используемых при записи текстов символов и соответствующих им двоичных кодов образуют кодовые таблицы. На практике применяют различные кодовые таблицы. Наиболее часто используется кодовая таблица ASCII (American Standart Code for Information Interchange – стандартный американский код для обмена информацией). Всего в ней зафиксированы коды для 128 различных символов. Но один байт может содержать 256 различных двоичных кодов, состоящих из 8 бит. Таким образом, в стандарте ASCII задействована только половина возможных кодов. Имеются различные расширения основной кодовой таблицы ASCII, в которых задаются коды еще для 128 символов, в том числе и для символов различных национальных алфавитов.

Знать кодовую таблицу наизусть не нужно. Все необходимые преобразования от символов к их кодам и назад – от кодов к символам – производятся машиной автоматически.

Существует много различных кодовых таблиц, и различные программы используют для записи текстов различные кодовые таблицы. А в различных кодовых таблицах один и тот же код соответствует разным символам. Следовательно, текст, записанный какой-либо программой в одной кодовой таблице, может быть полностью искажен при его чтении с помощью другой программы.

Существование большого количества кодировочных таблиц объясняется следующим: если учесть все возможные буквы, встречающиеся в национальных алфавитах европейских стран, все возможные символы, которые встречаются в математических и других специальных текстах, в алфавитах азиатских языков, то 256 символов окажется мало.

В последнее время все шире используется кодовая таблица UNICODE (UNIversal CODE – универсальный код), в которой для кода одного символа отводится 2 байта, а не один. Недостаток: требуется в два раза больше места в памяти, чем при записи в однобайтных кодировках. Но в связи с тем, что память становится все более и более дешевой, этот недостаток становится все менее значимым. Преимущество: с помощью 2 байтов, т. е. 16 разрядов, можно закодировать 216 = 65536 различных символов, а не 256. такого количества различных символов вполне достаточно для того. Чтобы представить практически все встречающиеся символы.

<== предыдущая лекция | следующая лекция ==>
 | Графическая информация
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 271; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.