Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

В-3 Количество информации. Методы оценки




В-2. Информация как часть информационного ресурса общества

В течение всей предшествующей XX в. истории развития человеческой цивилизации основным предметом труда оставались материальные объекты. Деятельность за пределами материального производства и обслуживания, как правило, относилась к категории непроизводительных затрат. Экономическая мощь государства измерялась его материальными ресурсами. В конце XX в. впервые в истории человечества основным предметом труда в общественном производстве промышленно развитых стран становится информация. Тенденция неуклонного перекачивания трудовых ресурсов из сферы материального производства в информационную сферу является сейчас наиболее заметным, но далеко не единственным симптомом приближающихся «гигантских потрясений», которые получили в наше время общее и несколько туманное название «информационный кризис».

Количество информации, поступающей в последние годы в промышленность, управление и научный мир, доходит до тревожных пропорций. Печать неудачно называет это «информационным взрывом». Неудачно потому, что взрыв быстро прекращает свой бурный рост. Рост же информации в перспективе не имеет конца. Общая сумма человеческих знаний изменялась раньше очень медленно: в 1800 г. она удваивалась каждые 50 лет, к 1950 г. удваивалась каждые 10 лет, к 1970 г. – каждые 5 лет, к 2000 г. – каждые два года.

Поэтому нельзя, видимо, считать случайным тот факт, что первая ЭВМ – основной инструмент еще не родившейся к тому времени науки об управлении информационными потоками – создавалась одновременно с урановым проектом и в значительной степени стимулировалась им. В 1948 г., спустя два-три года после начала эксплуатации первой ЭВМ, «отец кибернетики» Норберт Винер пытался пояснить сложившуюся в середине XX в. ситуацию кратким историческим экскурсом: «Идеи каждой эпохи отражаются в ее технике». Инженерами древности были земле меры, астрономы и мореплаватели; инженерами XVII и начала XVIII в. были часовщики и шлифовальщики линз... Основным практическим результатом этой техники, основанной на идеях Гюйгенса и Ньютона, была эпоха мореплавания, когда впервые стало возможным вычислять долготы с приемлемой точностью и торговля с заокеанскими странами, бывшая чем-то случайным и рискованным, превратилась в правильно поставленное предприятие. Это была техника коммерсантов.

Купца сменил фабрикант, а место хронометра заняла паровая машина. От машины Ньюкомена почти до настоящего времени основной областью техники было исследование первичных двигателей... Тепло было превращено в полезную энергию вращения и поступательного движения.

Итак, если XVII столетие и начало XVIII столетия – век часов, а конец XVIII и все XIX столетие – век паровых машин, то Настоящее время – это век связи и управления.

По оценкам специалистов, в течение 1980-х гг. расходы промышленно развитых стран на «технику слабых токов» – электронику и связь – превысили расходы на «технику сильных токов» – энергетику. Таким образом, к началу 1990-х гг. промышленно развитыми странами была пройдена указанная Н. Винером граница, отделяющая век энергетики от века информации. Например, в течение 1970-х гг. после более чем пятикратного повышения цен мирового рынка на основной энергоноситель – нефть суммарные затраты на генерирование, передачу и потребление энергии к началу 1980-х гг. стабилизировались в США на уровне 13% валового национального продукта (ВНП). Расходы же на приобретение и эксплуатацию вычислительной техники оценивались к концу 1970-х гг. в 5% ВНП. к 1985 г. – достигли 8%, к 1990 г. – 13%, а в 2000 г. составили уже 21%.

В настоящее время можно указать по крайней мере два показателя, каждый из которых убедительно свидетельствует о начале перехода промышленно развитых стран на качественно новый этап технологического развития, который принято называть веком информации:

1) время удвоения объема накопленных научных знаний составляет уже 2–3 года;

2) материальные затраты на хранение, передачу и переработку информации превышают аналогичные расходы на энергетику.

Однако если проблемы, которые принято объединять понятием «энергетический кризис», вызывают, как правило, общее понимание и предпринимаются организационные усилия на всех уровнях, чтобы обеспечить необходимую концентрацию сил для поиска путей их решения, то проблемы «информационного кризиса», которыми отмечается переход промышленно развитых стран от века энергетики в век информации, все еще воспринимаются намного труднее. Здесь, по-видимому, все дело в отсутствии исторического опыта. Как отмечал главный теоретик фирмы IBM Л. Бранскомб, «нам только еще предстоит узнать, каким он будет – век информации».

Растущая зависимость промышленно развитых стран от источников информации (технической, экономической, политической, военной и т. д.), а также от уровня развития и эффективности использования средств передачи и переработки информации привела к формированию на рубеже 1980-х гг. принципиально нового понятия – национальные информационные ресурсы.

Национальные информационные ресурсы – новая экономическая категория. Следует подчеркнуть, что политические и военные информационные факторы относятся к числу традиционно наиболее понятных, тысячелетиями развиваемых аспектов использования информационных ресурсов. Исторически новым оказался наблюдаемый за последние десятилетия в промышленно развитых странах процесс стремительного роста экономической значимости народнохозяйственных аспектов национальных информационных ресурсов. Корректная постановка вопроса о количественной оценке этих ресурсов и их связи с другими экономическими категориями еще ожидает разработки и потребует, видимо, длительных совместных усилий специалистов и ученых самых разных областей знаний.

На мировом рынке результаты промышленной эксплуатации национальных информационных ресурсов представлены в настоящее время тремя основными видами экспорта:

• экспортом овеществленных в наукоемких изделиях промышленности результатов научно-исследовательских и опытно-конструкторских работ (НИОКР);

• так называемым невидимым экспортом результатов НИОКР – патентами, лицензиями и т. д.;

• экспортом менеджмента – продажей технологии в области организации и управления производством.

Информационные ресурсы – это непосредственный продукт интеллектуальной деятельности наиболее квалифицированной и творчески активной части трудоспособного населения страны.

Вклад в формирование национальных информационных ресурсов вносят представители практически всех основных профессиональных групп: рабочие своими руками создают новые образцы сложных наукоемких изделий и участвуют в совершенствовании технологических процессов; специалисты – инженеры и техники проектируют эти изделия и технологические процессы; ученые закладывают фундаментальные основы технологии будущего; персонал управления производством, конторские служащие осваивают и развивают новые организационные формы эффективного управления современным производством. В сложившихся к началу 1980-х гг. социально-экономических условиях относительная ценность информационных ресурсов по отношению ко всем остальным национальным ресурсам имеет отчетливо выраженную тенденцию к возрастанию.

Осознание развитыми странами мира информации как стратегического ресурса позволило перейти к толкованию понятия информационного общества.

К характерным особенностям информационного общества как новой ступени в развитии современной цивилизации следует отнести:

• увеличение роли информации и знаний в жизни общества, создание и развитие рынка информации и знаний как факторов производства в дополнение к рынкам природных ресурсов, труда и капитала, превращение информационных ресурсов общества в реальные ресурсы социально-экономического развития;

• создание глобального информационного пространства, обеспечивающего эффективное информационное взаимодействие людей, их доступ к мировым информационным ресурсам и удовлетворение их социальных и личностных потребностей в информационных продуктах и услугах;

• становление и в последующем доминирование в экономике новых технологических укладов, базирующихся на массовом использовании информационно-коммуникационных технологий. Эти уклады не только обеспечивают постоянный рост производительности труда, но и ведут к появлению новых форм социальной и экономической деятельности (дистанционное образование, телеработа, телемедицина, электронная торговля, электронная демократия и др.);

• повышение уровня профессионального и общекультурного развития за счет совершенствования системы образования и расширения возможностей систем информационного обмена на международном, национальном и региональном уровнях, повышение роли квалификации, профессионализма и способностей к творчеству как важнейших характеристик услуг труда;

• создание эффективной системы обеспечения прав граждан и социальных институтов на свободное получение, распространение и использование информации как важнейшего условия демократического развития, улучшение взаимодействия населения с органами власти.

Для того чтобы оценить и измерить количество информации в соответствии с вышеизложенными аспектами, применяются различные подходы. Среди них выделяются статистический, семантический, прагматический и структурный. Исторически наибольшее развитие получил статистический подход.

Статистический подход изучается в разделе кибернетики, называемом теорией информации. Его основоположником считается К. Шеннон, опубликовавший в 1948 г. свою математическую теорию связи. Большой вклад в теорию информации до него внесли ученые Найквист и Хартли. В 1924 и 1928 гг. они опубликовали работы по теории телеграфии и передаче информации.

Признаны во всем мире исследования по теории информации российских ученых А.Н. Колмогорова, А.Я. Хинчина, В.А. Котельникова, А.А. Харкевича и др.

К. Шенноном было введено понятие количество информации как меры неопределенности состояния системы, снимаемой при получении информации. Количественно выраженная неопределенность состояния получила название энтропии по аналогии с подобным понятием в статистической механике. При получении информации уменьшается неопределенность, т. е. энтропия, системы. Очевидно, что чем больше информации получает наблюдатель, тем больше снимается неопределенность, и энтропия системы уменьшается. При энтропии, равной нулю, о системе имеется полная информация, и наблюдателю она представляется целиком упорядоченной.

Таким образом, получение информации связано с изменением степени неосведомленности получателя о состоянии этой системы.

До получения информации ее получатель мог иметь некоторые предварительные (априорные) сведения о системе X. Оставшаяся неосведомленность и является для него мерой неопределенности состояния (энтропией) системы. Обозначим априорную энтропию системы X через Н(Х). После получения некоторого сообщения наблюдатель приобрел дополнительную информацию I(Х), уменьшившую его начальную неосведомленность так, что апостериорная (после получения информации) неопределенность состояния системы стала Н’(Х).

Тогда количество информации может быть определено как

Другими словами, количество информации измеряется уменьшением (изменением) неопределенности состояния системы.

Если апостериорная энтропия системы обратится в нуль, то первоначально неполное знание заменится полным знанием и количество информации, полученной в этом случае наблюдателем, будет таково:

т.е. энтропия системы может рассматриваться как мера недостающей информации.

Если система X обладает дискретными состояниями (т.е. переходит из состояния в состояние скачком), их количество равно N, а вероятность нахождения системы в каждом из состояний Р, то согласно теореме Шеннона энтропия системы Н(Х) равна:

Здесь коэффициент К0 и основание логарифма а определяют систему единиц измерения количества информации. Логарифмическая мера информации была предложена Хартли для представления технических параметров систем связи как более удобная и более близкая к восприятию человеком, привыкшим к линейным сравнениям с принятыми эталонами. Например, каждый чувствует, что две однотипные дискеты должны обладать вдвое большей емкостью, чем одна, а два идентичных канала связи должны иметь удвоенную пропускную способность.

Знак «минус» перед коэффициентом К0 поставлен для того, чтобы значение энтропии было положительным, так как Pi < 1 и логарифм в этом случае отрицательный.

Если все состояния системы равновероятны, то энтропия рассчитывается по формуле

Энтропия Н обладает рядом свойств; укажем два из них:

1) Н = 0 только тогда, когда все вероятности Pi,кроме одной, равны нулю, а эта единственная вероятность равна единице.

Таким образом, Н = 0 только в случае полной определенности состояния системы;

2) при заданном числе состояний системы N величина Н максимальна и равна когда все Pi равны.

Определим единицы измерения количества информации с помощью выражения для энтропии системы с равновероятными состояниями.

Пусть система имеет два равновероятных состояния, т.е. N = 2. Будем считать, что снятие неопределенности о состоянии такой системы дает одну единицу информации, так как при полном снятии неопределенности энтропия количественно равна информации Н = I. Тогда

Очевидно, что правая часть равенства будет тождественно равна единице информации, если принять К0 = 1 и основание логарифма а = 2. В общем случае при N равновероятных состояний количество информации будет такова:

Эта формула получила название формулы Хартли и показывает, что количество информации, необходимое для снятия неопределенности о системе с равновероятными состояниями, зависит лишь от количества этих состояний.

Информация о состояниях системы передается получателю в виде сообщений, которые могут быть представлены в различной синтаксической форме, например в виде кодовых комбинаций, использующих т различных символов и п разрядов, в каждом из которых может находиться любой из символов. Если код не избыточен, то каждая кодовая комбинация отображает одно из состояний системы. Количество кодовых комбинаций будет

Подставив это выражение в формулу для I, получим:

Если код двоичный, т.е. используется лишь два символа (0 и 1), то количество информации в сообщении в этом случае составит п двоичных единиц. Эти единицы называют битами (от англ. Binary digit (bit) – двоичная цифра).

Следует еще раз отметить, что статистический подход к количественной оценке информации был рассмотрен для дискретных систем, случайным образом переходящих из состояния в состояние, и, следовательно, сообщение об этих состояниях также возникает случайным образом. Кроме того, статистический метод определения количества информации практически не учитывает семантического и прагматического аспектов информации.

Семантический подход определения количества информации является наиболее трудно формализуемым и до сих пор окончательно не определившимся.

Наибольшее признание для измерения смыслового содержания информации получила тезаурусная мера, предложенная Ю.И. Шнейдером. Идеи тезаурусного метода были сформулированы еще основоположником кибернетики Н. Винером. Для понимания и использования информации ее получатель должен обладать определенным запасом знаний.

Если индивидуальный тезаурус потребителя SП отражает его знания о данном предмете, то количество смысловой информации, содержащееся в некотором сообщении, можно оценить степенью изменения этого тезауруса, произошедшего под воздействием данного сообщения. Очевидно, что количество информации I с нелинейно зависит от состояния индивидуального тезауруса пользователя, и хотя смысловое содержание сообщения SП постоянно, пользователи, имеющие различные тезаурусы, будут получать неодинаковое количество информации. В самом деле, если индивидуальный тезаурус получателя информации близок к нулю (SП ~ 0), то в этом случае и количество воспринятой информации равно нулю: I с = 0.

Иными словами, получатель не понимает принятого сообщения и, как следствие, для него количество воспринятой информации равно нулю. Такая ситуация эквивалентна прослушиванию сообщения на неизвестном иностранном языке. Несомненно, сообщение не лишено смысла, однако оно непонятно, а значит, не имеет информативности.

Количество семантической информации Iс в сообщении также будет равно нулю, если пользователь информации абсолютно все знает о предмете, т.е. его тезаурус SП и сообщение не дают ему ничего нового.

Интуитивно мы чувствуем, что между этими полярными значениями тезауруса пользователя существует некоторое оптимальное значение SПопт при котором количество информации Iс, извлекаемое из сообщения, становится для получателя максимальным. Эта функция зависимости количества информации Iс от состояния индивидуального тезауруса пользователя SП приведена на рис. 1.4.

Рисунок 1.4 - Кривая функции Ic=f( SП )

Тезаурусный метод подтверждает тезис о том, что информация обладает свойством относительности и имеет, таким образом, относительную, субъективную ценность. Для того чтобы объективно оценивать научную информацию, появилось понятие общечеловеческого тезауруса, степень изменения которого и определяла бы значительность получаемых человечеством новых знаний.

Прагматический подход определяет количество информации как меры, способствующей достижению поставленной цели. Одной из первых работ, реализующей этот подход, явилась статья А.А. Харкевича. В ней он предлагал принять за меру ценности информации количество информации, необходимое для достижения поставленной цели. Этот подход базируется на статистической теории Шеннона и рассматривает количество информации как приращение вероятности достижения цели. Так, если принять вероятность достижения цели до получения информации равной Р 0,а после ее получения Р 1, прагматическое количество информации IП определяется как

Если основание логарифма сделать равным двум, то I П будет измеряться в битах, как и при статистическом подходе.

При оценке количества информации в семантическом и прагматическом аспектах необходимо учитывать и временную зависимость информации. Дело в том, что информация, особенно в системах управления экономическими объектами, имеет свойство стареть, т.е. ее ценность со временем падает, и важно использовать ее в момент наибольшей ценности.

Структурный подход связан с проблемами хранения, реорганизации и извлечения информации и по мере увеличения объемов накапливаемой в компьютерах информации приобретает все большее значение.

При структурном подходе абстрагируются от субъективности, относительной ценности информации и рассматривают логические и физические структуры организации информации. С изобретением компьютеров появилась возможность хранить на машинных носителях громадные объемы информации. Но для ее эффективного использования необходимо определить такие структуры организации информации, чтобы существовала возможность быстрого поиска, извлечения, записи, модификации информационной базы.

При машинном хранении структурной единицей информации является один байт, содержащий восемь бит (двоичных единиц информации). Менее определенной, но также переводимой в байты является неделимая единица экономической информации – реквизит.

Реквизиты объединяются в показатели, показатели – в записи, записи – в массивы, из массивов создаются комплексы массивов, а из комплексов – информационные базы. Структурная теория позволяет на логическом уровне определить оптимальную структуру информационной базы, которая затем с помощью определенных средств реализуется на физическом уровне – уровне технических устройств хранения информации. От выбранной структуры хранения зависит такой важный параметр, как время доступа к данным, т.е. структура влияет на время записи и считывания информации, а значит, и на время создания и реорганизации информационной базы.

Информационная база совместно с системой управления базой данных (СУБД) формирует автоматизированный банк данных.

Значение структурной теории информации растет при переходе от банков данных к банкам знаний, в которых информация подвергается еще более высокой степени структуризации.

После преобразования информации в машинную форму ее аналитический и прагматический аспекты как бы уходят в тень, и дальнейшая обработка информации происходит по «машинным законам», одинаковым для информации любого смыслового содержания. Информация в машинном виде, т. е. в форме электрических, магнитных и тому подобных сигналов и состояний, носит название данных. Для того чтобы понять их смысловое содержание, необходимо данные снова преобразовать в информацию (рис. 1.5).

Рисунок 1.5 - Схема преобразования «информация – данные»

Преобразования «информация – данные» производятся в устройствах ввода-вывода ЭВМ.




Поделиться с друзьями:


Дата добавления: 2013-12-13; Просмотров: 679; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.