Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Кодирование текстовой информации. Т Отношение количества семантической информации к объему данных принято называть относительной мерой количества семантической информации

Т Отношение количества семантической информации к объему данных принято называть относительной мерой количества семантической информации.

Формы адекватности и объем информации

Обычно информация должна быть адекватна образу (объекту), который она описывает.

Т Различают три формы адекватности информации:

· синтаксическая, отражающая формально-структурные свойства информации без учета ее смыслового содержания;

семантическая (смысловая), отражающая смысл информации и позволяющая судить о соответствии информационного образа объекта и самого объекта;

прагматическая (потребительская) ценность информации для тех целей, ради которых она используется.

Синтаксическая форма адекватности информации характеризуется объемом данных и количеством информации. Объем данных чаще всего измеряется числом символов (разрядов) в передаваемом сообщении. В двоичной системе один разряд - это бит (или байт = 8 бит), в десятичной системе - это число, представленное одной арабской цифрой (от 0 до 9).

Бит имеет всего два значения - логический 0 и 1 (или утверждения «Да» и «Нет» или «True» (Истина) и «False» (Фальшь или неправда). Бит может быть простейшим электрическим сигналом. Есть напряжение на проводе - это логическая единица, нет - логический ноль. Точная величина напряжения принципиального значения не имеет.

Роль двоичных чисел исключительно велика. Это связано с удобством их хранения в компьютерах, поскольку большинство запоминающих устройств построено на бинарных (двоичных) ячейках. Заряженный или разряженный конденсатор, намагниченный или размагниченный магнитный сердечник, триггер на транзисторах или электронных лампах - все это примеры устройств, имеющих два стабильных состояния равновесия.

Для измерения смыслового (семантического) количества информации используется тезаурус ~ совокупность сведений, которыми располагает пользователь или система распознавания информации.

Т Прагматическая мера информации определяет ее ценность для конкретного пользователя.


Чтобы эффективно накапливать, передавать и использовать информацию, ее надо представить в виде цифровых кодов, т.е. различающихся чисел, каждое из которых имеет значение некоторого «кванта» информации (т. е. ее неделимого значения). Эта операция называется кодированием информации.

Рассмотрим кодирование текстовой информации. Как известно, любой текст состоит из отдельных знаков - прежде всего букв и цифр. Совокупность таких знаков образует алфавит языка, а правила применения - синтаксис языка. Для работы с большинством языков (за исключением, возможно, китайского и японского) вполне достаточно двух-трех сотен знаков. Из этих знаков строятся слова, предложения, абзацы и главы текстовых документов.

В цифровых информационных системах и компьютерах каждый знак часто кодируется некоторым кодом - обычно целым числом (байтом) со значением от 0 до 255. Таким образом, задается 256 знаков (2 в степени 8). Этого вполне достаточно. 2 в степени 7 даст 128 значений - этого мало, а вот 2 в степени 9 - уже 512 значений. Этого уже много для большинства языков! К тому же число 8 кратно двум, вот почему именно единица памяти байт (28 состояний) стала основной.

Поэтому 256 день сентября считается – днем программистов, который вычислен математически 13 сентября) считается - днем программиста т.к. 28=256, количество чисел можно выразить с помощью одного байта (12 или 13 сентября). Байка программистов: "Начинающий программист верит, что в килобайте информации 1000 байт, а законченный считает, что в килограмме 1024 грамма".

 

<== предыдущая лекция | следующая лекция ==>
Понятие о сигналах | Цифровое кодирование графики и видео
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 363; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.