Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Информационные процессы




Конспект лекций

 

ЛЕКЦИЯ 1

Учебная презентация

Вопросы:

1) Источники информации. Основные понятия и определения.

2) Документальные информационные потоки (ДИП).

3) Понятие информационного процесса (сбор, обработка, хранение и поиск информации).

 

Вопрос 1. Источники информации. Основные понятия и определения. Источники информации подразделяются на документальные и фактографические. Документальный источник (документ) — это источник информации о фактах, событиях, явлениях реального мира и мыслительной деятельности человека, закрепленных различными способами на специальном носителе. Фактографический источник (фактографическое сообщение) — источник информации о конкретных фактах, фактических событиях или их совокупности, зафиксированных в определенной знаковой форме на каком-либо носителе. Любое фактографическое сообщение представлено в виде документа, но соотносится с ним как часть и целое.

Кроме фактографических сообщений существуют фактологические информационные сообщения, создаваемые путем последующей логической обработки фактографических сообщений и содержащие факты, которые отсутствуют в явном в виде в исходных материалах.

Документы, обращающиеся в сфере управления и коммуникаций, могут быть различных видов. В зависимости от знаковой формы представления информации различают документы:

- текстовые (знак — алфавит естественного языка);

- иконические (знак подобен обозначаемому объекту). Например, рисунки, фотографии, диапозитивы;

- идеографические (знак — условное обозначение объекта). Как-то: географические карты, атласы, чертежи, схемы;

- трех измерений (знак — сам материальный объект). Это — музейные экспонаты, исторические реликвии, образцы пород;

- машиночитаемые (знак — специально разработанные коды). Например, перфоленты, магнитные диски, CD-диски. Кроме данного термина, существуют: виртуальный, цифровой, электронный документ;

- аудиальные (звучащие, фонетические). Различные виды звукозаписи.

В свою очередь, текстовые документы подразделяются на первичные и вторичные. Первичные источники фиксируют результат человеческой деятельности. Дифференциация первичных источников происходит по различным аспектам: по способу размножения (опубликованные и неопубликованные); объему (микро и макроформные, промежуточные); по виду носителя (традиционные и нетрадиционные); содержанию (научные, технические, справочные, делопроизводственные и т.д.).

Вторичные документы и источники вторичной информации возникают в результате обработки и анализа первичных документов в различных информационных службах (аннотации, рефераты, библиографические описания, информационные издания и т.п.).

Вопрос 2. Документальны информационные потоки. Все множество первичных и вторичных документов, а также источников информации, целенаправленно передающихся по информационным каналам от отправителя к потребителю называется документальным информационным потоком.

Изучение ДИП в различных отраслях деятельности составляет одно из важных направлений документационного обеспечения управления, так как практически все процессы информационного обслуживания осуществляются на документальной основе. А исследование закономерностей потоков может содействовать повышению эффективности и оптимизации процессов управления.

Наибольшее распространение изучение ДИП получило в 1960-70-ых гг. в работах зарубежных ученых: Дж.Бернал, А.Лотка, Д.Прайс, российских: П.Рачков, Г.Добров.

Динамика роста ДИП характеризуется экспонентой и записывается формулой:

y=y0ekt

где y — количество документов в потоке;

y0 — их число в начале отсчета;

е=2,718 и составляет основание натурального логорифма;

t — временной интервал;

k — интенсивность прироста.

Экспоненциальный закон прироста документов был подтвержден многими исследованиями. В 1960-ых гг. мировой ДИП удваивался каждые 10-15 лет, в начале 1980-ых гг. -–через 12 лет, к середине 1980-ых гг. — через каждые 5 лет. В 1990ых гг. удвоение происходило каждые два года. В 2000 г.отечественный ДИП достиг примерно 8 млрд. единиц.

Это способствовало появлению так называемого "информационного взрыва" ("кризиса информации"). Данный термин относится не столько к чисто количественному росту потока, сколько к трудностям, которые возникают пути получения, обработки и освоения информации. Решение проблемы лежит в области разработки, внедрения компьютерных информационных систем (КИС, встречаются различные названия: информационно-поисковые системы, автоматизированные поисковые системы, информационные системы).

Вопрос 3. Понятие информационного процесса (сбор, обработка, хранение и поиск информации). Любая система действует в постоянной взаимосвязи с внешней средой. Осуществляется данная взаимосвязь посредством информации, которая по потокам прямой связи передает цель функционирования, команды управления от системы высокого уровня к системе более низкого звена, а по потокам обратной связи — все сведения, необходимые для регулирования процесса управления. Таким образом, взаимосвязь осуществляется с помощью информационных процессов. Под информационным процессом понимают взаимодействие между сообщением и отправителем/потребителем информации.

Совокупность сложных человеко-машинных информационных систем является важнейшей составляющей инфраструктуры общества, где информация выступает одним из главных его ресурсов. Поэтому является чрезвычайно важным понимание сути сложного технологического процесса сбора, передачи и обработки информации.

Сбор информации — процесс получения информационными службами сообщений всех видов по различным каналам связи. Система сбора информации представляет собой сложный программно-аппаратный комплекс. Как правило, современные системы не только обеспечивают кодирование информации и ее ввод в ЭВМ, но и выполняют первичную (предварительную) обработку этой информации.

К техническим средствам сбора информации относятся: алфавитно-цифровая клавиатура, сканеры и дигитайзеры, цифровые фотоаппараты и видеокамеры. В конечном счете любая информация попадает в ЭВМ в виде цифрового кода.

Информация очень разнообразна, сложна по структуре, размещается на различных носителях, может находиться в статичном и динамичном состояниях, поэтому каждый вид информации имеет свои технологии обработки, смысловую ценность, требования к точности, достоверности, формам представления.

Информационные сообщения, собранные по различным каналам связи, в дальнейшем подвергаются технической и научной обработке. Техническая обработка информации заключается в учете и регистрации поступающих сообщений. Научная обработка представляет собой информационный анализ и синтез сообщений и включает: синтаксический анализ — установление важнейших параметров информационного потока, включая необходимые количественные характеристики, для выбора технических средств последующей передачи, обработки, хранения информации; семантический анализ — изучение информации с точки зрения смыслового содержания ее отдельных элементов; прагматический анализ — определение полезности информации, используемой для управления.

Технология электронной обработки информации — это процесс исполнения взаимосвязанных операций, протекающих в установленной последовательности с целью преобразования первичной информации. Внутримашинная технология обработки информации реализует следующие типовые процессы преобразования первичной информации: формирование новых массивов информации, упорядочение информации, выборка из массива некоторых частей записи по условиям, по реквизитам, слияние и разделение массивов, внесение изменений, выполнение арифметических действий над данными или реквизитами.

 

 

ЛЕКЦИЯ 2

Информационная система

как средство реализации информационного поиска

 

Учебная презентация

Вопросы:

1) Информационный поиск.

2) Информационная система (ИС): понятие и структура.

3) Классификация ИС. Фактографические и документальные ИС.

 

Вопрос 1. Информационный поиск. Процесс, связанный с обеспечением сохранности собранных и обработанных данных, сведений для передачи их в пространстве и времени называется хранением информации. Сообщения, реализованные в определенной материальной форме, могут храниться в службах: документальной информации (книгохранилищах, музеях, архивов и т.л.); фактографической информации (редакции газет, телевидение, адресных столах, службах стандартов и т.д.); концептографической информации (службы патентной экспертизы, прогнозирования).

Документы, поступившие в информационные службы, подвергаются обработке и отправляются в хранилища, где располагаются в зависимости от принятой системы расстановки — формальной (алфавитная, хронологическая, языковая, номерная) или содержательной.

В результате аналитико-семантической переработки информации возникают вторичные документы, а также источники вторичной информации, которые также составляют содержание банков данных.

Для того, чтобы получить необходимые сведения осуществляют информационный поиск. Термин "информационный поиск" в научный обиход впервые ввел К. Муерс. Он понимал его как процесс поиска и выдачи информации в соответствии с ее тематическим содержанием. В настоящее время под информационным поиском понимается процесс нахождения в определенном упорядоченном множестве сообщений тех, которые соответствуют запросам потребителя или содержат необходимые потребителю факты и данные.

Информационный поиск реализуется с помощью информационных систем. Объектом информационного поиска могут быть первичные, вторичные документы, информационные издания, фактографические описания, прогнозы, научно-исследовательские обзоры в целом или в виде отдельных фрагментов. Другими словами, объектом информационного поиска является как сам материальный объект, так и его описание.

В зависимости от цели информационный поиск делится на адресный и семантический. От объекта — документальный и фактографический.

Адресный поиск — процесс разыскания информационных сообщений по чисто формальным признакам. Основное условие — наличие точного адреса (заголовок, инвентарный номер, авторский знак)

Семантический поиск — процесс разыскания информационных сообщений по их смыслу, содержанию. Одним из условий осуществления семантического поиска является перевод содержания информационного сообщения с естественного языка на информационно-поисковый язык.

При адресном поиске информационное сообщение рассматривается как объект (с точки зрения формы), а при семантическом — как носитель знания (с точки зрения содержания). Цель адресного поиска — нахождение объекта. Цель семантического поиска — нахождение информации по заданной теме, конкретному вопросу.

Документальный поиск — процесс разыскания первичных и вторичных источников информации, соответственно запросу потребителя.

Фактографический поиск — процесс извлечения фактографической информации.

Основу документального поиска составляет документ, а фактографического — факт.

Эффективность информационного поиска определяется прежде всего показателями, характеризующими процесс нахождения релевантных документов, т.е. семантическими показателями полноты и точности выдачи информации.

Полнота выдачи информации — количественная характеристика информационного поиска, определяемая отношением между числом выданных на данный запрос релевантных документов (а) и общим числом релевантных документов в информационном массиве (а+с). П=а/(а+с).

Точность выдачи информации — количественная характеристика информационного поиска, определяемая между числом релевантных документов (а) и общим количеством всех документов, выдаваемых в ответ на запрос (а+в). Т=а/(а+в).

Полнота и точность выдачи информации зависят от ряда факторов: типа информационно-поискового языка, метода индексирования документа и запросов, стратегии поиска, режима реализации поиска.

Кроме семантических критериев эффективности поиска, используются такие показатели, как оперативность, стоимость и трудоемкость поиска. Их называют технико-экономическими критериями.

Оперативность поиска — среднее время ответа на запрос.

Стоимость — совокупность денежных и материальных затрат на информационный поиск одного документа.

Трудоемкость поиска — затраты труда на поисковые операции при поиске одного документа.

Использование совокупности показателей эффективности информационного поиска является одним из направлений оптимизации работы информационных систем.

 

Вопрос 2. Информационные системы: понятие и структура. Основная задача курса состоит в том, чтобы познакомиться с принципами организации и обработки больших массивов данных об объектах и явлениях реального мира. Такие массивы данных вместе с программно-аппаратными средствами для их обработки называют информационными системами (ИС).

Для выполнения любого вида информационного поиска в состав ИС должны входить следующие элементы:

- информационный массив объектов — совокупность текстов документов, записей, фактографических описаний, данных, где происходит информационный поиск;

- логико-семантический аппарат, состоящий из информационно-поискового языка, методов индексирования и поиска информации;

- средства реализации — совокупность технических устройств, с помощью которых осуществляется хранение и поиск информации;

- люди, взаимодействующие с системой (пользователи, администраторы и т.д.)

 

Вопрос 3. Классификация ИС. Фактографические и документальные ИС. Все многообразие ИС классифицируется по присущим им признакам:

1) По профилю комплектования: универсальные, многоотраслевые и узкотематические. Библиотечные фонды, информационные издания — универсальные ИС; справочно-информационные фонды, реферативные журналы — многоотраслевые ИС; картотеки и указатели — узкотематические ИС.

2) По типам вводимых в ИС документов: текстовые (библиотеки), иконические (фототеки), идеографические (картотеки НОТ), аудиальные (фонотеки) и машиночитаемые (банки данных).

3) По типу используемого информационно-поискового языка: классификационные и дескрипторные.

4) По средствам реализации: ручные, механические и автоматизированные.

5) По виду информационного поиска информационные системы подразделяются на: фактографические; документальные.

В фактографических ИС регистрируются факты — конкретные значения данных (атрибутов) об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии, названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (дата — ДД.ММ.ГГ). Информация, с которой работает фактографическая ИС, имеет четкую структуру, позволяющую машине отличать одно данное от другого, — например, фамилию от должности человека, дату рождения от роста. Поэтому фактографические системы способна давать однозначные ответы на поставленные вопросы. Например, "Кто из работников фирмы с датой рождения не ранее 1 января 1970 г. имеют водительские права?", "Какие культурно-исторические памятники Беларуси включены в список ЮНЕСКО?" и т.д.

Документальные информационные системы обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги, рефераты, тексты законов) и графических объектов, снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, — выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям. Например, выдать список всех статей, в которых встречается слово "энтропия". Принципиальной особенностью документальной ИС является ее способность, с одной стороны, выдавать ненужные пользователю документы (там, где "энтропия" употреблена в ином смысле, чем предполагалось), а с другой — не выдавать нужные (если автор употребил какой-то синоним или ошибся в написании). Документальная система должна уметь по контексту определять смысл того или иного термина (Рак — животное; Рак — созвездие; Рак — болезнь).

Указанная классификация достаточно условна. В настоящее время современные фактографические системы часто работают с неструктурированными блоками информации (текстами, графикой, звуком, видео), снабженными структурированными описателями.

Основа информационной системы, объект ее обработки — база данных.

 

 




Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 2499; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.031 сек.