Сбор информации

⇐ Предыдущая 123 4 5 6 7 8 9 Следующая ⇒

Информационные процессы

Очевидно, чтобы иметь возможность сохранить или передать сведения об объектах и явлениях внешнего мира, необходимо' придать мысли материальную форму. Процессы изменения формы представления информации или ее содержания принято называть ее обработкой. Следовательно, данные – результат такого преобразования информации, при котором форма ее представления изменяется таким образом, что создается возможность хранить, передавать и обрабатывать информацию. Такая форма представления информации называется данными [10]. Процесс такого преобразования называется кодированием. При этом термин “код” служит для обозначения системы символов, применяемой для хранения, передачи и обработки информации.

Взаимосвязь объектов внешнего мира, информации и данных представлена на рис. 1.3. Из представленной схемы понятно, что когда человек считывает данные, в его сознании они воспринимаются как информация.

Совокупность последовательных действий, производимых над информацией, принято называть информационными процессами. В соответствии с [15] к числу информационных процессов относятся сбор, обработка, накопление, хранение, поиск и распространение информации. Рассмотрим подробнее эти процессы.

Условимся понимать, что сбор информации представляет собой процесс ее сосредоточения в устройствах внешней памяти компьютера. Очевидно, что первым этапом этого процесса является получение информации от объектов внешнего мира. На этом этапе реализуется способность живых организмов отражать различные свойства объектов, явлений и процессов окружающего мира. Все живые существа, даже самые простейшие, воспринимают информацию об окружающей их среде и реагируют на нее в целях обеспечения условий для своего существования и продолжения рода. У высших животных и человека для получения информации об окружающей среде имеются органы чувств, через которые воспринимается информация определенного вида.

Необходимость обмена информацией для обеспечения сохранения вида привела к появлению и развитию средств общения между живыми существами. У человека одним из таких средств общения является речь. В процессе общения объекты, их свойства* и связи между ними, отраженные в сознании человека, обозначаются соответствующим образом. Такие обозначения составляют основу языка и называются именами. Следовательно, в сознании человека полученная информация существует в форме мысли, выраженной в образах или в терминах устной речи. Это объясняется тем, что естественные человеческие языки представляют собой системы кодирования понятий для выражения мыслей посредством речи [5].

Второй этап процесса сбора информации заключается в том, что ее необходимо из сознания человека перенести в память компьютера. Для этой цели служат различные прикладные программы и устройства ввода. Очевидно, что при этом слова или образы, существующие в сознании человека, нужно преобразовать в форму, удобную для обработки компьютером, т.е. закодировать ее.

В способах получения информации человек пошел намного дальше других живых существ – он создал приборы, позволяющие извлекать ту информацию, которая недоступна ему в непосредственных ощущениях. К числу таких приборов относятся электронный микроскоп, телескоп, термометры, приборы инфракрасного видения, приборы фиксации ультразвука, радиометры и т.д. Более того, созданы системы, позволяющие организовать автоматический (без участия человека) сбор информации. Например, ЭВМ может периодически “опрашивать” один или несколько входных источников информации, “считывая” с них нужные сведения.

В вычислительной технике изначально используется система двоичного кодирования, основанная на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски – binary digit или сокращенно bit (бит).

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т.п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:

00 01 10 11

Тремя битами можно закодировать восемь различных значений:

000 001 010 011 100 101 110 111

Эти примеры показывают, что при увеличении количества разрядов в системе двоичного кодирования на единицу количество значений, которое может быть выражено в данной системе, увеличивается 2 раза, т.е. общая формула имеет вид:

N=2^m,

где N – количество независимых кодируемых значений; т – разрядность двоичного кодирования, принятая в данной системе.

Кодирование чисел. Целые числа кодируются двоичным кодом достаточно просто – достаточно взять целое число и делить его пополам до тех пор, пока частное не будет равно единице. Совокупность остатков от каждого деления, записанная справа налево вместе с последним частным, и образует двоичный аналог десятичного числа.

Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8 бит). Шестнадцать бит позволяют закодировать целые числа от 0 до 65 535, а 24 бита – уже более 16,5 миллионов разных значений.

Для кодирования действительных чисел используют 80-разрядное кодирование. При этом число предварительно преобразуется в нормализованную форму.

3,1415926 = 0,31415926 * 10¹;

300 000 = 0,3 * 10⁶;

123 456 789 = 0,123456789 * 10¹⁰.

Первая часть числа называется мантиссой, а вторая – характеристикой. Большую часть из 80 бит отводят для хранения мантиссы (вместе со знаком) и некоторое фиксированное количество разрядов – для хранения характеристики (тоже со знаком). Любое число можно представить в форме мантиссы с порядком.

Кодирование текстовых данных. Для кодирования текстовой информации с помощью двоичного кода можно путем постановки в соответствие каждому символу алфавита определенного целого числа (например, порядкового номера). В этом случае с помощью восьми двоичных разрядов можно обеспечить кодирование 256 различных символов. Это количество позволяет выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы.

Наиболее широко для кодирования текстовой информации используется система кодирования ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США). В этой системе вводятся две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0-го до 127-го, а расширенная относится к символам с номерами от 128-го до 255-го.

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств. Начиная с 32-го по 127-й код размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов.

Расширенная часть системы кодирования, определяющая значения кодов со 128-го по 255-й, используется для кодирования символов национальных алфавитов. Примеры таблиц кодирования приведены во многих источниках [9].

Кодирование графических данных. Графическое изображение, напечатанное в газете или книге, состоит из мельчайших точек, образующих характерный узор, называемый растром. Поскольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел, то можно сказать, что растровое кодирование позволяет использовать двоичный код для представления графических данных. Общепринятым на сегодняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и, таким образом, для кодирования яркости любой точки обычно достаточно восьмиразрядного двоичного числа.

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три основных цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). На практике считается (хотя теоретически это не совсем так), что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех основных цветов. Такая система кодирования называется системой RGB по первым буквам названий основных цветов.

Если для кодирования яркости каждой из основных составляющих использовать по 256 значений (восемь двоичных разрядов), как это принято для полутоновых черно-белых изображений, то на кодирование цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 миллионов различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).

Кодирование звуковой информации. В настоящее время для записи звуков с помощью двоичных кодов используется таблично-волновой метод (Wave-Table). Суть его сводится к тому, что создаются специальные таблицы, в которых хранятся образцы звуков для множества различных музыкальных инструментов. В технике такие образцы называют сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются “реальные” звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Единицы измерения данных. Поскольку разные типы данных имеют универсальное двоичное представление, постольку в информатике используются единицы данных, основанные на нем. Так, наименьшей единицей измерения является бит. Однако, как было показано ранее, даже для кодирования одного текстового символа нужно 8 бит. Такая единица измерения получила название 1 байт.,

Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах. Более крупная единица измерения – килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки, и потому на самом деле 1 Кбайт равен 2¹⁰ байт (1024 байт). Однако всюду, где это не принципиально, с инженерной погрешностью (до 3 %) “забывают” о “лишних” байтах.

В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-; в более крупных единицах пока нет практической надобности.

1 Мбайт = 1024 Кбайт = 10²⁰ байт;

1 Гбайт = 1024 Мбайт = 10³⁰ байт;

1 Тбайт = 1024 Гбайт = 10⁴⁰ байт.

Наглядное представление о соотношении количества информации, содержащейся в сообщениях, передаваемых с помощью различных носителей, дает следующий пример. На диске объемом 100 Мбайт может быть записано:

страниц текста – 50 000;

цветных фотографий – 150;

аудиозапись речи – 1,5 часа;

музыкальный фрагмент качества CD-стерео – 10 минут;

фильм высокого качества записи – 15 секунд;

протоколы операций с банковским счетом – за 1000 лет.

Таким образом, можно предположить, что сбор информации включает непосредственно получение информации, ее двоичное кодирование и запись во внешнюю память компьютера.

⇐ Предыдущая 123 4 5 6 7 8 9 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2014-12-26; Просмотров: 730; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.009 сек.