Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Кодирование информации и её представление в памяти компьютера




Вся информация в компьютере представляется в цифровой форме. Для чисел это представление является естественным. Для нечисловой информации (например, текста) используется стандартный прием: все возможные значения нумеруются и вместо самих значений хранятся их номера (которые играют роль кодов). Так, для представлении текстовой информации используется таблица символов, содержащая все символы алфавита, которые могут встретиться в тексте, а текст, хранящийся в памяти компьютера, заменяется списком номеров символов в этой таблице. Аналогично кодируется информация других видов. В любом случае содержание представляемых нечисловых данных, хранящихся в компьютере, зависит от таблиц нумерации (называемых таблицами кодирования).

Количество двоичных разрядов, необходимых для записи одного кода при таком способе записи, зависит от общего объема таблицы. Наибольшее число, которое в двоичной системе счисления можно записать с помощью N цифр, состоит из N единиц. Это число равно 1 + 2 + 4 +... + 2N-1 = 2N — 1. Например, с помощью 8 двоичных цифр можно различать 28 = 256 символов текста. Следовательно, для хранения кодов значений, общий объем которых равен числу M, необходимо примерно log2M двоичных разрядов.

Это рассуждение настолько важно для всей идеологии хранения информации в двоичном коде, что в информатике принято измерять объем данных и памяти компьютеров не в десятичной системе счисления, а в специальных единицах измерения, основанных на степенях двойки. Используя то обстоятельство, что 210= 1024 не очень отличается от 103= 1000, принято 1024 байта называть килобайтом (1Кб). Аналогично мегабайт (1Мб) — это 024 килобайта, а гигабайт (1Гб) — 1024 мегабайта. Количество информации в современном мире столь велико, что приходится вводить дополнительную единицу — терабайт (1Т6), равный 1024 гигабайтам. Если не нужна особая точность, то можно считать, что приблизительно 1 терабайт = 1 тыс. гигабайтов = 1 млн мегабайтов = = 1 млрд килобайтов = 1 трлн байтов.

Размерность информации За единицу информации принимают количество информации, заключенное в выборе одного из двух равновероятных событий. Эта единица называется двоичной единицей, или битом (binary digit, bit).

В информатике и вычислительной технике принята система представления данных двоичным кодом. Наименьшей единицей такого представления является бит.

Байт ¾ это группа взаимосвязанных битов. 1 байт = 8 бит. Одним байтом кодируется один символ текстовой информации.

1 Килобайт (Кб) = 1024 байт.

Однако, повсюду, где это не принципиально, считают, что 1 Кб равен 1000 байт. Условно можно считать, что одна страница неформатированного машинописного текста равна 2 Кб.

1 Мегабайт (Мб) = 1024 Кб.

1 Гигабайт (Гб) =1024 Мб.

1 Терабайт (Тб) = 1024 Гб.

Уже говорилось, что логически оперативная память компьютера представляет собой линейную последовательность байтов. Длина этой последовательности в современных персональных компьютерах достигает десятков и сотен мегабайтов. Еще больше память суперкомпьютеров.

Для хранения чисел в зависимости от их величины и точности выделяется несколько байтов памяти (от 1 до 10). Различают две основные формы представления числа в памяти компьютера. При первом способе все разряды выделенных для хранения числа байтов памяти последовательно нумеруются и двоичные цифры числа непосредственно записываются в соответствующие биты памяти. Один бит выделяется для представления знака числа (0 — плюс, 1 — минус). При втором способе число представляется в так называемой нормализованной (или экспоненциальной) форме: Х= М 10n, где число М (называемое мантиссой) заключено от 1 до 10, число п (называемое порядком) — целое.

Используется несколько форматов представления целых и нормализованных чисел, которые отличаются объемом и наличием или отсутствием знакового бита. От этого зависит диапазон чисел, которые могут быть представлены в данном формате. Например, если заранее известно, что какая-то целая величина положительна и не может быть больше 255, то для ее хранения достаточно 1 байта. Для хранения величин, изменяющихся в диапазоне от —215 = —32 768 до 215 — 1 = 32 767, выделяется 2 байта. Если целое число не вмещается в этот диапазон, то для его хранения выделяется 4 байта (диапазон от —231 до 231 - 1).

В принципе, подобный подход годится и для дробных чисел. L память компьютера заносятся цифры числа, но при этом считается, что на определенном месте этой записи стоит десятичная точка. Такая форма записи называется представлением числа с фиксированной точкой. Максимальное число цифр в числе и конкретное положение запятой определяются форматом числа. Предусмотрено несколько вариантов формата представления чисел с фиксированной точкой в памяти компьютера.

Представление нормализованных чисел называется представлением числа с плавающей точкой. Оно используется для хранения величин, которые могут принимать значения в очень большом диапазоне. В памяти компьютера порядок и мантисса хранятся отдельно в форме двоичных целых чисел со знаком. В современных компьютерах используется несколько форматов представления чисел с плавающей точкой, которые отличаются общим объемом представления чисел (6, 8 или 10 байтов), а также размерами памяти, отводимой отдельно для мантиссы и порядка. От этого зависят общий диапазон возможных значений числовой величины в компьютере и минимальная ошибка в вычислениях, проистекающая из-за невозможности запоминать в компьютере большее количество знаков после десятичной точки.

В действительности информация разнородна. Обычно делят данные на числовую, текстовую и логическую информацию. Под текстовой информацией понимается линейная последовательность символов. Для представления символа в памяти компьютера используется следующая схема: фиксируется множество допустимых символов текста (обычно их 28 = 256 символов), и каждому символу присваивается номер (от 0 до 255), который служит кодом символа. После этого последовательность символов заменяется на последовательность кодов, которые в памяти компьютера записываются в виде целых двоичных чисел (без знака). Код одного символа помещается в 1 байте памяти (именно поэтому исторически сложилось разбиение памяти на группы по 8 битов, так как оказалось, что оптимальное количество символов — 28, а не, например, 29).

Множество допустимых символов и их кодов составляют таблицу кодирования символов. Естественно, эта таблица не должна зависеть от произвола программиста или производителя компьютеров, поскольку обмен информацией в этом случае будет сильно затруднен. В настоя шее время существует стандарт ASC/f (American Standard Code for Informational Interchange), содержащий 128 основных символов (коды от 0 до 127) и 128 расширенных символов (коды от 128 до 255). Поскольку в этот стандарт не входят символы национальных алфавитов, в каждой стране 128 кодов расширенных символов (от 128 до 255) заменяются символами национального алфавита. Другими словами, каждый язык с алфавитом, отличным от английского, устанавливает свой стандарт. Осмысленный текст на одном языке будет бессмысленным на другом. Таким образом, для правильной работы с текстом важна не только сама информация, но и ее интерпретация. Программа, которая правильно интерпретирует коды символов в соответствии с таблицей кодирования в определенном алфавите, называется текстовым драйвером

Логическая величина — это величина, которая может принимать всего два значения: true и false («истина» и «ложь»). Для хранения значения логической переменной достаточно 1 бита. Обычно значение «единица» бита памяти ассоциируется с истиной, значение «ноль» — с ложью.

Для хранения в памяти компьютера более сложных объектов, таких, как видеоизображения или звуки, описания этих объектов преобразуются в числовую форму. Существует достаточно много способов кодирования такого вида информации, но в итоге изображение или звук представляются в виде последовательности нулей и единиц, которые размещаются в битах памяти компьютера и при необходимости извлекаются оттуда и интерпретируются определенным образом.




Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 1098; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.