КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Утворення класифікаційних угруповань
Застосування ієрархічного методу класифікації пояснюється його доброю пристосованістю до ручної обробки, звичністю, великою інформативністю кодів, які мають змістове навантаження. Проте цей метод класифікації має ряд недоліків, які іноді утруднюють його використання. Це передусім жорсткість структури, яка зумовлена фіксованістю ознак і їхньою послідовністю. Через це зміна хоча б однієї ознаки призводить до перерозподілу класифікаційних угруповань. Тому в класифікаторах, побудованих за ієрархічним методом, мають передбачатися значні резервні ємності. Крім того, ієрархічний метод класифікації не дає змоги агрегувати об’єкти за будь-яким раніше не передбаченим довільним поєднанням ознак, а також у деяких випадках ускладнює автоматизовану обробку, оскільки утворюється нестандартний розподіл послідовності ознак. Перелічені недоліки ієрархічного методу класифікації компенсуються фасетним методом, за якого початкова множина об’єктів може незалежно поділятися на класифікаційні угруповання щоразу з використанням однієї з обраних ознак. Кожна ознака фасетної класифікації відповідає фасеті, що являє собою список значень найменованої ознаки класифікації. Наприклад, ознака «колір» містить такий список значень: червоний, білий, чорний, блакитний... зелений; ознака — «професія» містить такий список значень: апаратник, автослюсар... токар і т. ін. Отже, система класифікації може бути подана переліком незалежних фасетів (списків), які містять значення ознак класифікації. Множинне описання об’єктів техніко-економічної інформації відбувається в кожній конкретній задачі на основі задання фасетної формули, яка утворюється з послідовності ознак класифікації, використовуваних у задачі. Кількість фасетних формул визначається можливим поєднанням ознак. Для кожної фасетної формули може бути утворена ієрархічна класифікація, в якій на кожному рівні поділу використовується одна ознака, що відповідає окремій фасеті, а послідовність ознак визначається фасетною формулою. Розглянемо, як гіпотетичний приклад фасетну класифікацію одягу в разі використання трьох ознак (фасетів): вид тканини, сезонність, призначення (рис. 4). З використанням цих трьох ознак шляхом переставлення їх послідовності можна побудувати шість різних ієрархічних класифікацій (з трьома рівнями розподілу). Один приклад наведено на рис. 5.
Рис. 4. Фасети ознак і їх значення
Рис. 5. Можливий варіант ієрархічної класифікації для заданої послідовності фасетів
Для цього прикладу одержаної ієрархічної класифікації три угруповання нижчого рівня містять відповідно такий одяг: 1) чоловічий, зимовий, вовняний; 2) жіночий, зимовий, вовняний; 3) дитячий, зимовий, вовняний. Якщо використати номери фасетів, наведених на рис. 4.3, то поданій на рис. 4.4 ієрархічній класифікації відповідає фасетна формула: 1—2—3, яка відбиває склад і послідовність ознак поділу. Крім наведених схем класифікації ці три ознаки дають змогу створити ще три схеми з використанням однієї ознаки і шість схем класифікації з використанням двох ознак. Отже, будь-яке угруповання у системі класифікації визначається набором значень ознак об’єктів класифікації (може бути одна або кілька ознак). Оскільки, як легко помітити з прикладу, наведеного на рис. 4.4, кількість можливих класифікацій швидко зростає зі зростанням кількості незалежних ознак, у ряді випадків краще мати перелік окремих фасетів — ознак; будь-яка комбінація фасетів визначає одну ієрархічну класифікацію, кожне угруповання якої визначається комбінацією значень ознак. Загалом уся множина об’єктів класифікації може описуватися досить великою кількістю дескрипторів, які відповідають значенням різних ознак множини об’єктів. Кожний об’єкт може описуватись якоюсь частиною цих значень. Очевидно, що будь-яка комбінація дескрипторів зі словника-тезауруса, який описує розглядувану множину, визначає можливий клас об’єктів. Цей клас містить певні частини об’єктів; у деяких випадках ця частина може бути порожньою. При застосуванні фасетного методу класифікації слід додержувати таких основних правил: · ознаки, які використовуються в різних фасетах, не повинні повторюватися (принцип взаємного виключення фасетів); · із усіляких ознак, які характеризують множину об’єктів класифікації, відбираються і фіксуються лише істотні, які забезпечують розв’язування конкретних економічних задач. Фасетний метод класифікації не має недоліків ієрархічного методу. Він особливо ефективний у разі функціонування комп’ютерних інформаційних систем. Засобом вираження результатів класифікації є кодування. Кодування — створення і присвоєння коду класифікаційному угрупованню та об’єкту класифікації (або процес присвоєння об’єкту певного коду). Код — знак або сукупність знаків, узятих для позначення класифікаційного угруповання і об’єкта класифікації. класифікація і кодування — це невіддільний елемент створення і функціонування комп’ютерних IС. Метою класифікації і кодування є упорядкування і взаємоузгодження різних предметів, понять, властивостей чи інших елементів інформації. Використанням кодів можна значно скоротити обсяги інформації та трудомісткість її обробки на всіх етапах технологічного процесу автоматизованої обробки даних. Тому питанням розробки раціональних класифікаторів під час проектування IС приділяється велика увага. Класифікатор — офіційний документ, що являє собою систематизований перелік назв і кодів класифікаційних угруповань або об’єктів класифікації. Методи кодування техніко-економічної інформації, які використовуються при створенні класифікаторів, безпосередньо пов’язані з методами класифікації. Кодування призначене для формалізованого опису семантики (назв) різноманітних аспектів даних, які використовуються в управлінні народним господарством, найчастіше у вигляді цифрових кодів. Таке подання найприйнятніше для підвищення ефективності автоматизованої обробки економічної інформації. Під кодуванням загалом розуміють процес позначення первинної множини об’єктів або повідомлень набором символів заданого алфавіту на основі сукупності певних правил. Системою кодування називають сукупність методів і правил позначення об’єктів заданої множини. Система кодування характеризується ємністю — кількістю кодів, що різняться між собою, тобто комбінацій, використаним алфавітом коду і правилами утворення коду. У процесі кодування економічної інформації необхідно розв’язати три основні задачі: однозначного позначення (індентифікації) кожного об’єкта заданої множини, кодування деякої сукупності властивостей (атрибутів) об’єкта і забезпечення інформаційної надійності або достовірності на всіх етапах кодування, передавання, зберігання і переробки даних. Для кодування інформації в інформаційних системах застосовують порядковий, серійно-порядковий, послідовний та паралельний методи кодування Найпростішим і найпоширенішим методом кодування об’єктів первинної множини є порядковий метод. При використанні цього методу кожний об’єкт класифікованої множини кодується за допомогою поточного номера. Порядковий метод застосовується при кодуванні одноознакових, сталих та малозначних номенклатур, наприклад, категорії персоналу, статті витрат, види платежів до бюджету тощо. Порядковий метод кодування дуже простий для ідентифікації. Але суттєвим недоліком даного методу є відсутність у коді будь-якої інформації про об’єкт і відносна складність автоматичної обробки інформації при підбитті підсумків за групами об’єктів. Притаманні порядковому методу кодування недоліки деякою мірою усунуті в серійно-порядковому методі кодування. Метод характеризується тим, що первинна множина поділяється на кілька частин (згідно з деякою ознакою) і для кодування об’єктів кожної частини призначається серія номерів (кодів). Об’єкти кодуються порядковим номером у межах відведених для них серій. Цей метод кодування використовується для об’єктів, які мають дві ознаки. Можна припустити, що при такому кодуванні використовується змінний алфавіт коду. Наприклад, з номера 1-го по 5-й закодовано одну частину об’єктів, з 6-го по 15-й — другу, з 16-го по 25-й — третю і т. д. При кодуванні сукупності властивостей об’єктів, тобто при створенні інформаційного блока, рекомендують застосовувати два основних методи створення коду: послідовного кодування на основі використання ієрархічної класифікації і паралельного кодування на основі фасетної класифікації. При використанні фасетної класифікації кожне угруповання системи класифікації відповідає деякій сукупності значень властивостей об’єктів. При цьому кожне угруповання першого рівня поділу відповідає одному значенню, другого — значенню двох властивостей і т.ін. У кожній вітці ієрархічної класифікації, як правило, використовується своя сукупність властивостей. Значення властивості, записаної на певному розряді коду у вигляді цифр (групи цифр), залежить при цьому від значення цифр на попередніх розрядах (десятках). Якщо розглядати структуру кодової комбінації в разі послідовного кодування, слід зазначити, що код угруповання створюється на основі коду угруповання попереднього рівня додаванням до нього ще одного розряду (або групи розрядів). Так, якщо в ієрархічній класифікації використовується послідовність угруповань під назвами «клас», «підклас», «група», «підгрупа» і на кожному рівні розподілу може бути до десяти номенклатур, то для позначення класу можна використати одну цифру, для підкласу — дві і т. д. При використанні послідовного методу логічно будується код (кодова комбінація), який має велику інформативність. Але код при цьому дуже громіздкий і складної структури. Через негнучкість послідовного методу кодування його доцільно використовувати лише в тих випадках, коли техніко-економічна інформація змінюється у незначних розмірах або зовсім не змінюється протягом тривалого часу використання класифікаторів. Метод широко застосовується при розробці загальнодержавних класифікаторів продукції, галузей і т. ін. Якщо для позначення кожної окремої ознаки незалежно використовується один або кілька розрядів коду, то такий метод кодування сукупності властивостей називають паралельним, а інакше — незалежним, або фасетним. Структура коду сукупності властивостей при паралельному методі відповідає фасетній формулі. На рис. 6 подано код класифікаційного угруповання, яке об’єднує об’єкти, що характеризуються чотирма властивостями. Як видно з рис. 6, значення кожної властивості кодується незалежно, а послідовність властивостей визначається конкретною фасетною формулою (1—2—3—4), код 040109502. Рис. 6. Паралельний метод кодування
При застосуванні паралельного методу кодування на противагу послідовному значення ознаки, записане на будь-якому розряді коду, не залежить від значень ознак, записаних на інших розрядах. Це дає змогу за конкретним кодом легко дізнатись, набором яких ознак описується розглядуваний об’єкт. Найчастіше ознака задається у вигляді кодової таблиці. Паралельний метод кодування дає багатоаспектну класифікацію. Вона добре пристосована для машинної обробки і розв’язання різних економічних задач. Блокова побудова коду за фасетами спрощує його стандартизацію. До недоліків цього методу кодування належить менша порівняно з послідовним методом інформативність і ємність, що пояснюється неповним використанням останньої. При розв’язуванні економічних задач слід забезпечити їх порівнянність. Порівнянність результатів розв’язування різних економічних задач у різних сферах управлінської діяльності і на різних рівнях управління народним господарством, а також можливість використання цих результатів для розв’язування інших задач можуть бути забезпечені за наявності єдиних систем угруповань, здобутих за єдиними класифікаційними ознаками. Ці проблеми розв’язуються створенням Єдиної системи класифікації та кодування техніко-економічної інформації (ЄСКК ТЕI). ЄСКК являє собою комплекс взаємозв’язаних класифікаторів техніко-економічної інформації, пристосованих до безпосередньої обробки засобами обчислювальної техніки з автоматизованою системою ведення цих класифікаторів. Отже, ЄСКК складається із сукупності взаємопов’язаних класифікаторів техніко-економічної інформації, систем їх ведення, науково-методичних і нормативно-технічних документів з розробки, ведення та впровадження, а також організацій і служб, які виконують роботи з класифікації та кодування. ЄСКК ТЕI встановлює склад та зміст робіт із класифікації та кодування техніко-економічної інформації, єдиний порядок планування та виконання цих робіт у країні. Держстандартом допускається використання класифікаторів таких видів: — загальнодержавні (державні) класифікатори; — міжгалузеві класифікатори; — галузеві класифікатори; — класифікатори підприємств (локальні).
Дата добавления: 2014-01-06; Просмотров: 1274; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |