Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Банки документов




Банки данных

Банки информации

Лекция 33.

Банк данных — наиболее характерный пример информационной системы. В банке данных хранится достаточно универсальная, необходимая для решения разнообразных прикладных задач, информация об определенной предметной области в специальном представлении, чаще всего предполагающем хранение и обработку с помощью компьютеров. При этом сами данные образуют базу данных, а банк, наряду с базой, содержит программные средства обработки данных и реализации запросов, т.е. систему управления базой данных (СУБД). Как правило, банки данных являются системами коллективного пользования. К информации, хранимой в них, часто можно получить доступ по телекоммуникационным сетям.

Остановимся на классификации банков информации. Эта классификация может быть проведена с разных точек зрения. По назначению можно выделить следующие классы банков информации:

o информационно-справочные системы (общего назначения и специализированные);

o банки данных в автоматизированных системах управления (предприятий и организаций, технологическими процессами и т.д.);

o банки данных в системах автоматизации научных исследований.

По режиму функционирования можно рассматривать банки информации пакетного, диалогового и смешанного типов. В связи с широким распространением персональных компьютеров, бокальных и глобальных сетей ЭВС подавляющее распространение получили диалоговые системы.

По архитектуре вычислительной среды различают централизованные и распределенные банки информации.

 

В документальной информационно-поисковой системе выделяют следующие компоненты:

o массив документов (текстов) или фактов, выступающих в качестве объектов хранения и поиска;

o информационно-поисковый язык, предназначенный для отображения содержания документов и операций над ними, в том числе и запросов для поиска документов;

o правила, алгоритмы, методы индексирования и поиска документов, позволяющие описывать документы и операции над ними на информационно-поисковом языке;

o комплекс программных и аппаратных средств, с помощью которых реализуются процессы накопления, хранения и поиска документов;

o обслуживающий персонал, включающий администратора банка документов, системных аналитиков, программистов и индексаторов.

Банки документов работают обычно в двух режимах:

1. избирательного распределения информации, обеспечивающего регулярное текущее информирование пользователей бака о новых поступлениях документов;

2. ретроспективного поиска информации по разовым запросам во всем массиве документов.

Важнейший этап обработки нового документа при поступлении его в хранилище документальной информационно-поисковой системы — индексирование документа слагается из следующих действий:

1. выявления основного смыслового содержания документа (с учетом точки зрения автора документа и информационных потребностей пользователя системы);

2. описания смыслового содержания документа на информационно-поисковом языке (ИПЯ) и получении соответствующего поискового образа документа (ПОД).

Информационно-поисковые языки (ИПЯ), которые используются в настоящее время, можно разделить на три большие группы:

o классификационные языки;

o дескрипторные;

o комбинированные.

Языки классификационного типа, в свою очередь, делятся по структуре:

o ИПЯ иерархической структуры;

o ИПЯ фасетной структуры;

o эмпирические (неиерархические) языки.

Классификационные системы. В иерархических классификационных системах лексические единицы (термины) находятся между собой в отношениях включения. При записи они располагаются в порядке постепенного перехода от общих к более частным. Существуют иерархические системы, в которых рубрики включают по 20 и более подклассов, рубрик и подрубрик в нисходящем порядке. Примером такой иерархической классификационной системы является универсальная десятичная классификация (УДК), широко используемая в библиотечном деле и документальных поисковых системах. УДК охватывает весь спектр знаний.

В основе фасетной классификации лежит много аспектное распределение понятий какой-либо отрасли науки или техники по однородным взаимно исключающим друг друга фасетам.

Примером эмпирической (неиерархической) классификации может быть алфавитно-предметная классификация. Словарный запас такой классификации состоит из упорядоченного по алфавиту множества слов, словосочетаний и фраз естественного языка, обозначающих предметы какой-либо отрасли науки или практической деятельности. Каждому предметы или вопросу при этом отводится только один индекс, собирающий всю информацию относительно данного предмета или вопроса независимо от аспекта рассмотрения.

Дескрипторные информационно-поисковые языки. Дескрипторные информационно-поисковые языки основаны на методе координатного индексирования, сущность которого сводится к тому, что смысловое содержание документа может быть с достаточной точностью и полнотой выражено списком ключевых слов, содержащихся в тексте.

Ключевое слово — это лексическая единица информационно-поискового языка, являющаяся существительным, прилагательным, глаголом, наречием, числительным или местоимением естественного языка или словосочетанием. Основной критерий отбора ключевых слов из текста — степень их полезности ля индексирования документа или запроса.

В дескрипторной статье тезауруса обычно устанавливаются следующие виды семантических отношений:

o отношение синонимии;

o отношение подчинения;

o отношение ассоциации.

Пример дескрипторной статьи:

языки алгоритмические; синонимы: алгоритмические языки;

машинно-ориентированные языки, проблемно-ориентированные языки; вышестоящие: программное обеспечение;

языки формальные; нижестоящие: автокоды

алгол; паскаль; фортран; си; бейсик; ассоциации: алгоритмы, программирование

 




Поделиться с друзьями:


Дата добавления: 2014-10-23; Просмотров: 693; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.