Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Предметы и цели метаописаний научных информационных ресурсов




Проблема определения предмета описания непосредственно связана с задачами членения информационного массива (или, в некоторых случаях, скорее "потока информации") и идентификации информационных объектов. Наиболее очевидный и часто встречающийся способ членения информационного массива опирается на факт размещения несовпадающих (то есть не являющихся точными копиями друг друга по содержанию) подмассивов информации (документов, произведений и их совокупностей) на отдельных носителях информации. На этой основе строятся чаще всего описания книг, журналов и другой полиграфической продукции. Таковы же обычно и описания тиражируемых электронных изданий на съемных носителях.

При размещении информации в сети некоторым аналогом членения информационного массива по информационным носителям является соотнесение разных фрагментов массива с различными сетевыми адресами. Заметим, что иерархическая структура сетевых адресов позволяет, сохраняя данный принцип членения информации, создавать многоуровневые описания информационных ресурсов или, по крайней мере, выбирать уровень описания, в наибольшей степени соответствующий поставленным целям.

Следует отметить, что метаописание, содержащее электронный адрес информационного объекта (или программно связанное с этим адресом), является фактически описанием не только собственно информации, а некоторого элемента конкретной информационной системы со своими правилами и возможностями хранения, обработки, поиска и выдачи информации. В традиционной библиотеке или архиве аналогом такого описания является каталожная карточка, содержащая адрес (шифр хранения) книги, документа (единицы хранения).

Реально широко распространенными собраниями метаописаний, не содержащих адреса хранения информации, являются лишь библиографические и реферативно-библиографические издания. Система метаданных для них ограничивается фактически элементами "классического" библиографического описания. Во всех остальных случаях система метаданных может и должна включать интересующие пользователя сведения о порядке и условиях доступа к информации, предоставляемых информационной системой возможностях обработки информации. Особенно актуальной такая информация может быть для пользователей многих научных информационных систем, предоставляющих разнообразные возможности обработки информации (как содержащейся в системе, так и в ряде систем дополнительно вводимой пользователем), включая осуществление средствами системы различных вычислений, построение графиков и другие возможности. Такие дополнительные возможности информационных систем последнее время часто называют научными сервисами.

В зависимости от поставленных целей предметом метаописания могут быть информационные единицы (фрагменты), меньшие, чем те, что объединяются единым носителем или сетевым адресом. Это, например, отдельные документы и статьи в сборниках (обычно в несетевых изданиях), разделы, главы некоторого произведения, фрагменты текста, несущие ту или иную смысловую нагрузку, фрагменты, имеющие разную семиотическую природу (текст на естественном языке, таблицы, рисунки, видео и так далее). В этих случаях идентификация объектов описания связана с членением целостных изданий и разметкой текста, осуществляемыми либо автором (составителем) и отражаемыми, например, содержанием (оглавлением) издания, либо дополнительно в рамках информационной системы, в которой эти издания, документы, информационные массивы планируется использовать. В качестве эффективного инструмента такой дополнительной разметки, эксплицитной с точки зрения автоматизированной обработки информации, широко применяется в настоящее время язык XML (Extensible Markup Language – "расширяемый язык разметки"), точнее его синтаксис.

Еще чаще, чем фрагменты произведений (изданий, документов) предметом метаописаний становятся более крупные информационные объекты – базы данных, объединяющие множество отдельных документов или фактографических описаний отдельных объектов, электронные библиотеки, музейные, архивные и книжные коллекции, аудио- и видеофонды и так далее. Во многих случаях такие совокупные объекты физически представлены на множестве разных носителей или занимают некоторое множество сетевых адресов, обычно связанных иерархически.

Следует отметить, что, несмотря на явную "многоуровневость" большинства информационных ресурсов, значительная часть применяемых ныне систем метаданных либо прямо "настроены" только на один уровень членения информационного континуума (обычно это уровень отдельных изданий или произведений), либо пытаются игнорировать, хотя бы на верхнем уровне своей структуры, различия предметов описания. Последнее характерно для так называемых универсальных систем метаданных, наиболее распространенным представителем которых сейчас стало Дублинское ядро (Dublin Core, далее – DC). Стремление обеспечить единство структуры описания любых информационных объектов, облегчая в определенной степени автоматизированную обработку описаний, приводит в ряде случаев к фактической неоднозначности трактовки и практики использования некоторых элементов системы метаданных для объектов разного уровня.

Так, ясно, что интерпретации категории DC "создатель" ("creator") будут несколько различными, например, для документальной базы данных и для входящих в нее документов. В то же время, для многих пользователей их оценка необходимости к базе в целом может зависеть и от перечня авторов отдельных документов, вошедших в базу данных. Точное отражение семиотической природы информации (в DC, например, отражаемой обычно с помощью разных значений категории "тип ресурса" – текст, изображение, звук и так далее) легче удается в описаниях небольших информационных объектов (фрагментов). Для крупных объектов (книга, содержащая иллюстрации, тем более целая библиотека) часто указывается только превалирующая форма. То же можно отметить и в отношении такой традиционной категории метаописания как "язык" и некоторых других. Эти примеры свидетельствуют о желательности, по крайней мере в части случаев, создания взаимосвязанных описаний различных уровней представления (членения) информационных ресурсов.

Различные технологии разметки (прежде всего, XML-технологии) дают возможность создания удобных для использования в сетевом режиме описаний многоуровневых информационных объектов. Некоторые системы метаданных имеют средства для установления соответствий между различными описаниями (в DC, например, через категорию "связи"). В то же время, на практике почти не встречаются научные информационные системы, которые бы в явном, удобном для использования виде содержали взаимосвязанные метаописания как крупных информационных ресурсов, так и входящих в них объектов и фрагментов этих объектов.

Подобная ситуация объясняется, с одной стороны, большой трудоемкостью создания такой объединенной системы метаописаний для сколько-нибудь широкого круга крупных информационных ресурсов и упоминавшимися выше сложностями построения семантики системы метаданных для описания многоуровневых информационных объектов. С другой стороны, цели формирования массивов метаописаний в конкретных случаях связаны обычно с идентификацией ряда однородных объектов одного уровня, а не с решением задачи создания исчерпывающей информационной модели. Поэтому для того, чтобы перейти от описаний объектов одного уровня к описаниям объектов другого уровня чаще всего надо перейти к другому каталогу или другой, быть может связанной ссылками, поисковой системе (подсистеме).

Цели создания метаописаний в основном можно разделить на две группы: поиск информационных объектов и организация управления функционирования и использования этих объектов в информационной системе. Кроме того, метаописания могут использоваться с целью исследования существующих информационных ресурсов, например, для получения статистических сведений о них без непосредственного обращения к самим ресурсам. Исследовательские задачи, однако, являются, как правило, вторичными, и сами элементы метаописаний (метаданные) устанавливаются исходно для выполнения тех или иных функций при решении задач поиска или/и управления.

Характер и состав метаданных, используемых для поиска информационных объектов, определяются теми критериями, представлениями и знаниями, которые пользователи соотносят с требуемым предметом поиска. Чаще всего, особенно при поиске научных документов и их собраний, пользователь предъявляет требования к содержанию, предметной области искомых информационных ресурсов. Метаданными в этом случае следует считать любые элементы, используемые применяемой информационной системой для определения тематики просматриваемых документов (ресурсов, фрагментов и т.п.). Такие элементы обычно представлены различными классификационными индексами предметно-тематических классификаций, ключевыми словами, дескрипторами, стандартизованными элементами изображений и так далее. Поисковые элементы могут быть или заранее приписаны искомым объектам (в том числе составлять их специально выделенную часть) или вычленяться из текста (изображения) в ходе самого поиска средствами поисковой системы. При использовании предметно-тематических классификаций в сетевых гипертекстовых системах "приписывание" поисковых элементов ресурсам (или другим искомым информационным объектам) осуществляется обычно путем установления отсылки от рубрик классификации к соответствующим ресурсам и построения таким образом виртуального каталога ресурсов.

Наиболее удобным непосредственно для человека (в отличие от автоматизированной системы) источником сведений о содержании отдельных документов и более крупных информационных объектов является, безусловно, текст на естественном языке в виде аннотации или реферата. Поэтому аннотации и рефераты остаются важной частью многих систем метаописаний информационных ресурсов.

Иногда в качестве дополнительного средства идентификации тематической направленности материалов могут использоваться и иные данные, не относящиеся к классификационным или лексическим единицам. Это, например, фамилии авторов и названия организаций, известных пользователю. Однако изначально подобные данные предназначены и чаще всего используются не для тематического поиска, а для поиска и идентификации конкретных документов, изданий, составных произведений и коллекций.

Как отмечалось ранее, метаданные применяются и в целях организации управления информационными ресурсами в конкретной информационной системе. Это, прежде всего, указания на то, какие процедуры, кем на каких и при каких условиях могут (или должны) осуществляться с данным информационным ресурсов (отдельным документом и даже частью документа). Этот класс метаданных используется, например, для управления доступом к данным, для организации процесса ведения информационных массивов, обмена данными между взаимодействующими системами и т.п. Примеры метаданных данного класса имеются в разделе 4 настоящего отчета.

Некоторые метаданные о функционировании информационного ресурса в конкретной системе могут быть интересны и для пользователя при определении желательности получения той или иной информации. Это, прежде всего, так называемый рейтинг ресурса, измеряемый часто количеством обращений к нему, но иногда и более сложным образом определяемой количественной оценкой качества материала.

Для информационного обеспечения научной сферы помимо сведений о самих информационных ресурсах и порядке их функционирования в информационной системе весьма часто для пользователя представляет интерес информация об исследовании, научном проекте, программе, в рамках или на основе которых создан информационный ресурс или отдельный научный документ. Такими сведениями могут быть, например, место проведения исследований, проект, программа, экспедиция, в которых получены результаты, описанные или использованные в работе, применявшиеся в ходе исследования методы, инструменты и так далее. В результате появляются возможности управления процессом консолидации разнородных массивов данных в рамках крупных научных проектов или для целых специализированных областей исследований. Суммируя сказанное в данном разделе, следует отметить, что метаданные могут относиться к объектам различного уровня, как например:

o предметно-тематические области,

o научные программы и проекты,

o наборы и коллекции данных и документов,

o конкретные произведения, их части и фрагменты,

o реализации информационных ресурсов и отдельных документов в конкретных системах.

Кроме того, метаданные могут использоваться для решения многих различных (хотя и родственных) задач, как в интересах пользователей, так и владельцев информационной системы. Тем не менее, на практике существует стремление к целостному описанию информационных объектов. Это приводит к распространению в большей или меньшей степени универсальных наборов (систем) метаданных, постепенной стандартизации методов отражения конкретных значений метаданных в этих системах. В то же время, нельзя не отметить, что в большинстве случаев универсальные системы метаданных однозначно задают лишь общую структуру, синтаксис описаний, которые для многих конкретных систем оказываются избыточными, а для других – требуют расширения и спецификации отдельных параметров. Поэтому для исследования систем метаданных следует рассматривать не только их общую семантико-синтаксическую структуру и реализующие ее программные средства, форматы и протоколы, но и особенности функционирования как универсальных, так и узкоспециализированных научно-информационных систем, использующих те или иные виды метаданных. В связи с этим дальнейшие разделы настоящего отчета в основном связаны с описанием отдельных проектов и систем, показавшихся авторам наиболее характерными и перспективными с точки зрения применения метаописаний.




Поделиться с друзьями:


Дата добавления: 2014-12-26; Просмотров: 377; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.016 сек.