КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Единиц информации
КЛАССИФИКАЦИЯ И ОСНОВНЫЕ СВОЙСТВА Базовые операции Web-ИРБИС 64 Общие сведения Программное обеспечение системы Web-ИРБИС 64 предназначено для осуществления доступа пользователей Интернет к электронным каталогам и другим библиографическим базам данных системы автоматизации библиотек ИРБИС64. Система Web-ИРБИС 64 представляет собой типовое интегрированное решение в области автоматизации библиотечных технологий и предназначена для использования в библиотеках любого типа и профиля для использования в качестве одного из основных компонентов библиотечных Интернет-серверов и Интернет-комплексов. Система полностью отвечает международным требованиям, предъявляемым к таким системам, и поддерживает все отечественные библиографические стандарты и форматы. Используется кодировка символов в соответствии со стандартом Юникод (UTF-8). · Поиск в произвольной базе данных, имеющей структуру ИРБИС64 по неограниченному числу полей, по любым элементам описания и их комбинаций, с применением логики «И», «ИЛИ» и «ФРАЗА ЦЕЛИКОМ», с возможностями определения префиксов и квалификаторов поисковых терминов, грамматической нормализации слов русского языка и применения аппарата усечений. · Уточняющий поиск в результатах предыдущего поиска по условию (последовательный поиск). Сортировка результатов поиска по условиям. · Высокая скорость выполнения запросов различной степени сложности. · Использование при поиске статических словарей и рубрикаторов, включенных в поисковые формы, с возможностью комбинирования элементов словарей с любыми другими поисковыми предписаниями. · Использование динамических словарей баз данных, с возможностью получения списка терминов словаря и последующего поиска по выбранным терминам; навигация по словарям, включая задание начала сканирования словарей по первым символам, а также в терминах «следующие»-«предыдущие». · Показ найденных записей в стандартных форматах, включая информационный и в виде каталожной карточки. Существуют две основные единицы информации - атрибут и составная единица информации. Определение атрибута было дано ранее. Атрибут соответствует понятию переменной в языках программирования и понятию реквизита в бухгалтерском учете. Атрибут характеризуется именем и значением. Именем атрибута называется его условное обозначение в процессах обработки данных. Значением атрибута называется величина, характеризующая некоторое свойство объекта, явления, процесса в конкретных обстоятельствах. Все допустимые значения атрибута образуют множество, называемое доменом этого атрибута. Формально атрибут с именем Х представляет собой пару (X,z), где z - элемент Z. Множество Z называется доменом значений (областью определения атрибута X), величина Z является значением атрибута Х в заданный момент времени. Определение домена предполагает указание его имени и списка значений. Если число значений в домене невелико, то их список можно указать при объявлении данных в программе. Например, в языке программирования Паскаль это выглядит как type day=1..31; month= (январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь); уеаг=1900.. 1999; (в описании типа атрибутов перечисляются допустимые значения атрибутов День, Месяц и Год соответственно).
Зачастую невозможно перечислить все элементы домена, поэтому для домена указываются тип и длина значения. Наиболее употребительны текстовые (символьные), числовые, логические значения, а также значения дат и другие специальные типы значений. Пример Домен фамилий - FAM. Перечислить фамилии невозможно, поэтому ограничим FAMзначениями текстового типа длиной до 20 символов. Для языка Паскаль получим: varFAM: string[20];
В домене, определенном таким образом, могут оказаться элементы, заведомо не являющиеся фамилией, например «ММММ», но такие случаи при определении домена не учитываются. Для ряда доменов множество входящих в них значений задается с помощью перечисления допустимых значений. Если в домене необходимо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены.
Классификация и кодирование Рассмотрим простейшие системы классификации и кодирования, применяемые для обозначения объектов в базе данных вместо их полных названий. В первую очередь, если классификация объектов вообще не требуется, производится их нумерация, и кодом каждого объекта служит его порядковый номер. Такая система кодирования называется порядковой. Если все множество объектов классифицируется по одному признаку, то коды объектов целесообразно разделить на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии использовать последовательные номера. Когда используется несколько классификационных признаков и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д., удобно использовать разрядную систему кодирования. В качестве примера рассмотрим различные системы кодирования значений атрибута Код студента. Порядковый код студента - это просто его номер в списке всех студентов. Предположим, что необходимо различать студентов-дневников, вечерников и заочников с использованием серийной системы кодирования. Для этого последовательные номера от 1 до 5999 будем использовать при кодировании дневников, номера от 6000 до 7999 - при кодировании вечерников, от 8000 до 9999 - при кодировании заочников. Если в этих же условиях применить разрядный код, то первый знак кода будет принимать три значения (1 -дневное отделение, 2 - вечернее, 3 - заочное), а следующие 4 знака отводятся для нумерации студентов каждого отделения. В разрядном коде можно учесть больше признаков, например, первый знак - код отделения, второй - код факультета, третий - код курса, четвертый - код группы, пятый и шестой - порядковый номер студента в группе. Обратите внимание, что, увеличивая число различимых признаков в коде, мы вынуждены увеличивать и длину значения атрибута Код студента. Разрядная система кодирования применяется для кодирования объектов, определяемых несколькими соподчиненными признаками. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации. Каждому признаку классификации отводится определенное число разрядов, в пределах которого кодирование начинается с единицы. Классификационные группировки по младшим признакам кодируются в зависимости от кода более старшего признака. Если значения нескольких атрибутов определены на одном и том же домене, то такие атрибуты называются ролевыми. На домене FAMмогут быть определены атрибуты с именами: Студент, Преподаватель, Автор. Все это ролевые атрибуты. Атрибуты Фамилия рабочего и Табельный номер рабочего неролевые, хотя описывают одних и тех же людей. Домен значений, как правило, не хранится в базе данных как самостоятельный информационный объект. Однако среди ролевых атрибутов домена в базе данных, безусловно, существует атрибут с наиболее полным перечнем значений, и этот атрибут необходимо использовать для контроля достоверности вновь вводимой информации. Например, на предприятии наиболее полный список сотрудников должен присутствовать в базе данных отдела кадров. Составной единицей информации (СЕИ) называется набор из атрибутов и, возможно, других СЕИ. Определение СЕИ построено рекурсивно (т. е. в определении понятия участвует само понятие), но противоречия здесь нет, поскольку «другие СЕИ» когда-нибудь будут состоять только из атрибутов (ввиду конечности сообщений). Атрибут и отношение образуют минимально возможный набор единиц информации. Следует отметить, что БД в целом также является единицей информации. Множество атрибутов объединяется в одну СЕИ по следующим принципам: •соответствующие атрибуты описывают один и тот же факт или экономический процесс, •значения атрибутов, входящих в СЕИ, возникают одновременно, связаны логическими или арифметическими соотношениями. Простейшими характеристиками СЕИ являются имя, структура и значение. Имя СЕИ - это ее условное обозначение в процессах обработки информации. Структурой СЕИ называется вхождение одних единиц информации в состав других единиц информации. Аппарат СЕИ рассчитан на описание структуры экономических документов. Документом называется материальный носитель информации (обычно бланк бумаги), содержащий оформленные в установленном порядке сообщения и имеющий юридическую силу. Существует сравнительно много способов описания структуры СЕИ. Для описания, не зависимого от конкретных языков программирования и СУБД, достаточно указывать после имени СЕИ список имен входящих в нее атрибутов и СЕИ. Будем помещать этот список в круглые скобки, а имена внутри скобок перечислять через запятую. Имя СЕИ может сопровождаться размерностью, т.е. указанием на количество одинаковых по структуре значений этой СЕИ. Размерность, если она не равна 1, указывается в скобках после имени СЕИ.
Дата добавления: 2014-01-07; Просмотров: 291; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |