Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Кодирование объектов




Классификация объектов

Классификация различных объектов, явлений, свойств и т.п. широко используется в мировой и отечественной практике для сбора, обработки и представления необходимой информации. Можно сказать, что классификация — это основа систематизации объектов, которая, в свою очередь, является первым этапом работ по унификации и стандартизации.

Классификация объектов необходима, прежде всего, в том случае, когда стоит задача по обработке информации о множестве объектов, отличающихся существенными признаками, т. е. когда из множества объектов необходимо получить информацию об определенных подмножествах. Например, общее множество продукции (товаров) насчитывает десятки миллионов наименований конкретных изделий: самолеты и зерно, насосы и ткани, обувь, лампочки и т.д. Информация о продукции обрабатывается во многих автоматизированных системах, связанных с учетом материальных ресурсов и их распределением. При этом задачи, связанные с продукцией, решаются на уровне автоматизированных систем отдельных предприятий, регионов, страны в целом и международного сотрудничества.

Информацию о продукции необходимо так разложить пополочкам (классифицировать), чтобы каждый пользователь мог брать только ту, которая необходима для решения его задач. К большим множествам можно отнести информацию о населении, о предприятиях и организациях, об услугах населению, о видах деятельности и т.д.

Основными методами классификации объектов технико-экономической и социальной информации являются иерархический и фасетный.

Иерархический метод классификации характеризуется тем, что исходное множество объектов последовательно разделяется на подмножества (классификационные группировки), а те, в свою очередь — на подмножества и т.д.

И так, множество объектов разделяется на классы, группы, виды и т.п. по основным признакам, характеризующим эти объекты по принципу «от общего к частному», т.е. каждая группировка в соответствии с выбранным признаком (основанием деления) делится на несколько других группировок, каждая из которых по другому признаку делится еще на несколько подчиненных группировок, и т.д. Таким образом, между классификационными группировками устанавливается отношение подчинения (иерархии).

Построение иерархической классификации объектов, как правило, происходит в такой последовательности:

· определяется множество объектов, которое необходимо классифицировать (множество людей, предприятий, процессов и т.д.) для решения конкретных задач;

· выделяются основные признаки (свойства, характеристики, показатели, параметры и др.), по которым множество будет разделяться на подмножества;

· выбирается порядок следования признаков — уровень деления и их количество.

· При построении иерархической классификации необходимо соблюдать наиболее важные правила:

· разделение множества на подмножества на каждом уровне производится только по одному признаку деления;

· получаемые в результате деления группировки на каждом уровне относятся только к одной вышестоящей группировке и не пересекаются, т.е. не повторяются;

· разделение множества осуществляется без пропусков очередного или добавления промежуточного уровня деления;

· классификация производится таким образом, чтобы сумма образованных подмножеств составляла делимое множество.

Наиболее существенными и сложными вопросами, возникающими при построении иерархической классификации, считаются выбор системы признаков (П), используемых в качестве основания деления, и определение порядка их следования.

В основу иерархической классификации закладываются признаки, являющиеся необходимыми в решении задач, для которых она создается. При этом последовательность признаков определяется по принципу «от общего к частному» с учетом приоритетной вероятности обращений к разным уровням деления при решении конкретных задач. Схематически формирование подмножеств объектов по иерархическому методу классификации представлено на рис. 5.2.


 
   
 


М

Уровни деления:

 

N1 первый

 

 

N2 второй

 

 

N3 третий

N4 четвертый

 

 

Последовательное деление множества

 

Рис. 5.2 Формирование подмножества объективов по иерархическому методу

Изображенная на рис. 5.2 классификационная схема соответствует реальной, используемой в Общероссийском классификаторе продукции (ОКП), где в качестве множества (М) взят класс 47 — «Тракторы и сельскохозяйственные машины».

Первый уровень деления сформирован по признаку перечня однородных групп продукции, входящих в М:

m1 — резерв;

m2 — тракторы;

m3 — машины сельскохозяйственные;

m4 — машины для животноводства, птицеводства и кормопроизводства;

m5 — двигатели тракторов и сельхозмашин, узлы и детали двигателей;

m6 — агрегаты, узлы и детали тракторов;

m7 — агрегаты, узлы и детали сельхозмашин и др.

Второй уровень деления, например для тг — тракторы, сформирован по признаку их применения:

m2.1 - резерв;

m2.2 - тракторы сельскохозяйственные общего назначения;

m2.3 - тракторы сельскохозяйственные универсально-пропашные;

m2.4 - тракторы сельскохозяйственные специальные (виноградниковые, свекловодческие, мелиоративные и др.);

m2.5 - тракторы лесопромышленные (трелеровочные, лесосплавные и др.);

m2.6 - тракторы промышленные.

Третий уровень деления, например для m2.3 — тракторы сельскохозяйственные универсально-пропашные, сформирован по признаку тяговых классов:

m2.3.1 - тракторы тяговых классов до 0,9;

m2.3.2 - тракторы тяговых классов свыше 0,9 и до 1,4;

m2.3.3 - тракторы тяговых классов свыше 1,4 и до 2.

Четвертый уровень деления, например для m2.3.2 — тракторы тяговых классов свыше 0,9 и до 1,4, сформирован по признаку мощности:

m2.3.2.1 - мощностью свыше 23,7 и до 47,8 кВт;

m2.3.2.2 - мощностью свыше 47,8 и до 80,9 кВт.

Основные преимущества иерархической классификации заключаются в ее логичности, последовательности и хорошей приспособленности для ручной обработки информации. А недостатком является малая гибкость структуры, обусловленная фиксированностью признаков (оснований деления) и заранее установленным порядком их следования. Включение новых уровней деления по дополнительным признакам весьма затруднительно, особенно если не предусмотрены резервные емкости. Кроме того, иерархический метод не позволяет агрегировать

объекты по необходимому для конкретных задач сочетанию признаков, что еще раз подтверждает его негибкость.

Фасетный метод классификации характеризуется тем, что множество объектов разделяется на независимые подмножества (классификационные группировки), обладающие определенными заданными признаками, необходимыми для решения конкретных задач.

Последовательность построения фасетной классификации практически такая же, как при построении иерархической, т.е. определяется множество объектов, выделяются основные признаки и группы признаков этого множества, и выбирается порядок следования групп признаков (фасетов) и признаков-характеристик.

Для вычленения из множества объектов конкретного подмножества, обладающего определенными признаками, необходимо выделить основные признаки-характеристики, всесторонне характеризующие объект и обеспечивающие его идентификацию, сгруппировать их по принципу однородности в фасеты и присвоить им коды, определить фасетные формулы для образования подмножеств.


Особенность фасетного метода состоит в том, что подмножества формируются по принципу «от частного к общему», т.е. на основе различных наборов конкретных характеристик объекта формируются конкретные подмножества (рис. 5.3)

 

Рис. 5.3. Формирование подмножеств объектов по фасетному методу

Например, из множества работающих на предприятии необходимо выбрать специалистов с высшим образованием, имеющих стаж работы 15 лет и более, свободно владеющих монгольским языком.

Решение указанной задачи можно обеспечить на основе Общероссийского классификатора информации о населении, содержащего необходимые фасеты и признаки:

фасет 30 — образование;

признак 18 — высшее образование;

фасет 21 — стаж работы;

признак 33 — 15 лет и более;

фасет 05 — степень знания иностранных языков;

признак 3 — владеет свободно;

фасет 04 — языки народов РФ и иностранные языки;

признак 125 — монгольский.

Перечень специалистов, обладающих указанными признака­ми, составит искомое подмножество.

При создании фасетной классификации необходимо соблюдать следующие основные правила:

· признаки в различных фасетах не пересекаются, т.е. каждый признак отличается от другого по наименованию, значению и кодовому обозначению;

· из общего числа фасетов, характеризующих множество объектов, выбираются фасеты, необходимые для решения поставленных задач, и устанавливается их строгая последовательность (фасетная формула).

Основным преимуществом фасетной классификации является ее гибкость, которая позволяет систематизировать объекты по необходимому набору признаков и осуществлять информационный поиск по любому сочетанию фасетов. Она также хорошо приспособлена для компьютерного формирования подмножеств на основе выбранного перечня признаков, но менее удобна для ручной обработки информации.

Кодирование представляет собой образование по определенным правилам и присвоение кодов объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Стремление к минимизации количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки информации.

Кодовое обозначение характеризуется:

· алфавитом кода;

· структурой кода;

· числом знаков — длиной кода;

· методом кодирования.

Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печатающего устройства. В этой связи коды бывают цифровые, буквенные и буквенно-цифровые.

Наиболее широкое применение в отечественной, зарубежной и международной практике кодирования информации находят цифровые коды. При этом, как правило, используются десятичные коды, т.е. когда подмножество не превышает 10 объектов, код составляет один знак — от 0 до 9 включительно, а когда не превышает 100 объектов, код составляет два знака — от 00 до 99 включительно и т.д. Установлено, что наибольшая эффективность в процессе обработки информации обеспечивается при применении цифровых кодов из пяти и менее цифр.

Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления.


Структура кода для Общероссийского классификатора продукции, например, может быть представлена в следующем виде:

 

Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусматривать резервные коды.

Методы кодирования в значительной степени связаны с методами разделения множества на подмножества.

Как отмечалось выше, метод присвоения объектам порядковых цифровых номеров, при котором кодовыми обозначениями служат числа натурального ряда, обеспечивает полную идентификацию объектов, но не является информативным, так как не отражает признаков, присущих множеству. В отличие от него идентификационные методы кодирования обеспечивают идентификацию объектов через коды, составленные по определенным правилам и включающим определенный набор кодов отдельных признаков, характеризующих эти объекты.

Коды должны удовлетворять следующим основным требованиям:

· однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;

· иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;

· иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;

· быть удобными для использования человеком, а также для компьютерной обработки закодированной информации;

· обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

Классификационные методы кодирования разделяются на два типа: последовательный и параллельный.

Последовательный метод чаще всего используется при иерархическом методе классификации, когда множество разделяется на подмножества в нужной последовательности и когда кодовое обозначение строится по заданной структуре, определяющей последовательность и количественный состав признаков на каждом уровне деления. К его недостаткам следует отнести зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков, через которые идентифицируется объект.

Параллельный (независимый) метод чаще всего используется при фасетной классификации объектов, когда коды присваиваются фасетам и признакам независимо друг от друга. В этом случае структура кодового обозначения определяется фасетной формулой. Данный метод хорошо приспособлен для машинной обработки и решения технико-экономических задач, характер которых часто меняется, и для тех случаев, когда необходимо анализировать различные множества объектов. Он обеспечивает возможность независимого изменения и дополнения характеристик объектов и их различных сочетаний, необходимых для решения конкретных задач. К недостаткам параллельного метода следует отнести некоторую громоздкость фасетных формул и избыточную емкость кодов.

Необходимо отметить, что кодирование при обоих методах осуществляется путем присвоения порядковых номеров, причем параллельный метод может успешно применяться при иерархическом методе классификации, когда одинаковыми кодами кодируются одинаковые объекты (признаки), находящиеся на одном уровне деления, но в разных подмножествах.

Ниже представлен фрагмент класса 88 — «Обувь из ОКП», при создании которого использовались различные методы кодирования.

88 0000 Обувь 88 2000 Обувь хромовая

88 2100 Обувь хромовая мужская

88 1000 Обувь юфтевая 88 2110 Обувь хромовая мужская повседневная

88 2111 Сапоги

88 1100 Обувь юфтевая мужская 88 2113 Сапожки

88 1110 Обувь юфтевая мужская 88 2114 Полусапожки

повседневная

88 1111 Сапоги 88 2115 Ботинки

88 1112 Полусапоги 88 2116 Полуботинки

88 1113 Сапожки 88 2117 Туфли

88 1115 Ботинки 88 2118 Туфли летние и сандалеты

88 1200 Обувь юфтевая женская 88 2200 Обувь хромовая женская

88 1210 Обувь юфтевая женская 88 2210 Обувь хромовая женская повседневная

повседневная

88 1211 Сапоги 88 2211 Сапоги

88 1212 Полусапоги 88 2213 Сапожки

88 1213 Сапожки 88 2214 Полусапожки

88 1214 Полусапожки 88 2215 Ботинки

88 1215 Ботинки 88 2216 Полуботинки

88 2217 Туфли

88 2218 Туфли летние и сандалеты

88 3000 Обувь с верхом из текстильных материалов, войлока или фетра

88 4000 Обувь с верхом из синтетических материалов

В данном фрагменте код 88 представляет собой порядковый номер, выделенный для обуви из 99 номеров классов.

На втором уровне деления (в подклассе) в качестве признака принят материал верха обуви и последовательно закодированы:

(88) I — обувь юфтевая;

(88)2 — обувь хромовая;

(88)3 — обувь с верхом из текстильных материалов, войлока, фетра и т.д.

На третьем уровне деления (в группе) в качестве признака используется принадлежность обуви: 1 — мужская, 2 — женская. Коды этих признаков параллельно повторяются на уровне груп­пы, например:

(881)1 — обувь юфтевая мужская;

(881)2 — обувь юфтевая женская;

(882)1 — обувь хромовая мужская;

(882)2 — обувь хромовая женская.

Также параллельным методом закодированы признаки на последующих уровнях классификации, что позволяет при компьютерной обработке получить нужную информацию, например о сапогах различной принадлежности, различного применения, сделанных из разных материалов.

При фасетной классификации коды признаков, входящих в отдельные фасеты, представляют собой, как правило, порядковые номера либо строятся на основе классификационных методов кодирования.

Контроль кода необходим для исключения ошибок при вводе в компьютерные системы, особенно это касается кодов большой длины (пять и более знаков).

С целью недопущения в компьютерные системы ошибочных кодов используется контрольное число, обеспечивающее автоматический контроль вводимого кода. Контрольное число рассчитывается по определенному алгоритму на основе знаков, составляющих код, и становится контрольной частью кодового обозначения.

Методов расчета контрольного числа известно много. Широко распространен, например, контроль по модулю. В качестве модуля используются числа, при делении на которые наиболее часто получается остаток, например 9, 10, 11, 37 и др. Наиболее эффективен контроль по модулю 11, по которому рассчитываются контрольные числа для Общероссийских классификаторов технико-экономической и социальной информации.

Алгоритм расчета контрольного числа по модулю 11 для кода 342415представлен ниже.

Каждый разряд кода умножается на число натурального ряда, соответствующее последовательности расположения разряда в коде, и все произведения суммируются:

3·1+4·2 + 2·3 + 4·4+1·5 + 5·6 = 68.

Затем сумма произведений делится на 11:

68: 11 = 66 + 2 в остатке.

Остаток от деления, т.е. 2, и составляет контрольное число.

Другой алгоритм расчета контрольного числа показан на примере 12-разрядного кода товара системы штрихового кодирования EAN: 460123456789.

Суммируются цифры, стоящие в коде на четных местах:

6+1 + 3 + 5+ 7 + 9 = 31.

Полученный результат умножается на 3:

31 · 3 = 93.

Суммируются цифры, стоящие в коде на нечетных местах:

4 + 0 + 2 + 4 + 6 + 8=24.

Суммируются результаты двух последних действий:

93 + 24 = 117.

Контрольным числом для этого кода будет то, которое необходимо добавить к этой сумме (к 117), чтобы получить число, делящееся без остатка на 10. Это число 3, которое становится неотъемлемой частью кода EAN-13.

При каждом считывании этого кода в компьютер вводятся все 13 цифр кода. Затем по первым 12 компьютер по указанному алгоритму подсчитывает контрольное число, и оно сравнивается со считанной тринадцатой цифрой. При совпадении этих цифр код «пропускается» в компьютер, а при несовпадении не пропускается, что является сигналом для необходимости дополнительной проверки кода.

 




Поделиться с друзьями:


Дата добавления: 2015-04-29; Просмотров: 1074; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.