Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Понятия и основные системы кодирования экономической информации




Основные понятия классификации экономической информации

В условиях рыночной экономики возрастает роль информа­ции как одного из наиболее важных ресурсов предприятия, необ­ходимого для принятия эффективных и своевременных управлен­ческих решений. Одним из наиболее существенных компонентов этого ресурса является экономическая информация, основные особенности которой следующие:

• большие объемы ежегодно создаваемой, обрабатываемой и хранимой информации (до нескольких сотен млн. символов в год для среднего предприятия);

• большая часть этой информации имеет символьное представ­ление, слабо приспособленное для логической и арифмети­ческой обработки;

• высокий уровень стоимостных и трудовых затрат на поиск и ее обработку.

Для того чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем фор­мализовать (закодировать) с использованием классификатора. Классификатор - это документ, с помощью которого осуществля­ется формализованное описание экономической информации в ЭИС, содержащей наименования объектов, наименования класси­фикационных группировок и их кодовые обозначения.

Экономическая информация существует в двух формах: в фор­ме экономических показателей и документов.

Экономический показатель является составной единицей ин­формации, отражающей количественную характеристику неко­торого процесса предметной области - реквизит-основание вмес­те с однозначно определяющими его качество реквизитами-признаками [51 ]. Структура показателя представлена на рис. 4.1.

Реквизиты-основания подразделяются по типу алгоритмов их получения на количественные, стоимостные, проценты, удельные веса и др. Множество реквизитов-признаков по степени формали­зации делится на два подмножества:

справочные реквизиты-признаки, - как правило, наименования предназначены для понимания показателя пользователем-эко­номистом;

группировочные реквизиты-признаки - это закодированные ана­логи справочных признаков, предназначенные для логичес­кой обработки информации на ЭВМ.

Основными объектами классификации и кодирования являются справочные реквизиты-признаки, описывающие процессы, место, время выполнения процессов, субъекты и объекты действия, отра­жаемые в показателе. Например, к числу Наименований элементов можно отнести наименования материальных, трудовых, денежных, теоретических ресурсов, основных средств, готовой продукции и услуг. К числу наименований процессов относятся наименования функций управления, деловых процессов, операций поступления сырья и материалов, отпуска их в производство, производства и выпуска готовой продукции или оказания услуг, процессов выпол­нения заказов, обслуживания клиентов, хранения, реализации го­товой продукции, расчетов с поставщиками и покупателями, по­лучения оплаты за реализованную продукцию и т.д.

К объектам классификации и кодирования относятся также наименования показателей и документов. Помимо этого к объек­там классификации и кодирования относят также наименования компонентов проекта ЭИС, в том числе файлов, задач, подсис­тем, программных модулей и др.

Целью разработки классификаторов является установление соответствия между значениями справочных или описательных признаков какого-либо элемента или процесса и значениями группировочных признаков, например между значением рекви­зита «Фамилия И.О. рабочего» и значением «Табельный номер» рабочего или между значениями «Наименование материала» и «Код материала».

Для кодирования объектов необходимо их упорядочить по некоторым признакам. Результат упорядоченного распределения объектов заданного множества носит название классификации, а совокупность правил распределения объектов множества на под­множества называется системой классификации. Процесс распре­деления объектов классификации в соответствии с принятой сис­темой классификации носит название процесса классифицирова­ния. То свойство или характеристика объекта классификации, Которое позволяет установить его сходство или различие с дру­гими объектами классификации, называется признаком классифи­кации. Множество или подмножество, объединяющее часть объек­тов классификации по одному или нескольким признакам, носит Название классификационной группировки.

Основанием классификации называется признак, по которому ведется разбиение множества на подмножества на определенной ступени классификации. Ступень классификации - это результат очередного распределения объектов одной классификационной группировки. Уровень классификации - это совокупность класси­фикационных группировок, расположенных на одних и тех же сту­пенях классификации. Глубина системы классификации - это коли­чество уровней классификации, допустимое в данной системе.

Каждая система классификации характеризуется следующи­ми свойствами:

• гибкостью системы;

• емкостью системы;

• степенью заполненности системы (коэффициент заполнен­ности).

Гибкость системы - это способность допускать включение новых признаков, объектов без разрушения структуры клас­сификатора. Гибкость определяется временем жизни (Тж) сис­темы.

Емкость системы - это наибольшее количество классифика­ционных группировок, допускаемое в данной системе классифи­кации (Р).

Степень заполненности системы (Кзап) определяется как част­ное от деления фактического количества группировок (QФ) на величину емкости системы (Р):

Кзап= QФ / Р

В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.

Характерными особенностями иерархической системы явля­ются:

• наличие в системе неограниченного количества признаков классификации;

• соподчиненность признаков классификации, что выражается разбиением каждой классификационной группировки, обра­зованной по одному признаку, на множество классификаци­онных группировок по нижестоящему (подчиненному) при­знаку.

При построении иерархической системы классификации сна­чала выделяется некоторое множество объектов, подлежащее классифицированию Мо, для которого определяются полное мно­жество признаков классификации G и их соподчиненность друг другу, затем производится разбиение исходного множества объек­тов на классификационные группировки на каждой ступени клас­сификации (рис. 4.2).

При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:

• получающиеся на каждом уровне классификационные груп­пировки должны составлять исходное множество объектов Мо;

• классификационные группировки Хjk на каждой ступени не должны пересекаться;

• классификация на каждой ступени должна проводиться толь­ко по одному признаку (G).

К положительным сторонам данной системы следует отнести логичность, простоту ее построения и удобство логической и арифметической обработки.

Мо={х12...,хi......хn} -мощность классифицируемого множества,

где g1, g2,... - признаки классификации и g1 € G, g2 € G

Однако эта система характеризуется жесткой структурой классификации, не позволяющей вносить новые признаки или изменять их последовательность. Гибкость этой системы обес­печивается только за счет ввода большой избыточности в вет­вях, что приводит к слабой заполненности структуры класси­фикатора.

Недостатки, отмеченные в иерархической системе, отсутству­ют в других системах, которые относятся к классу многоаспект­ных систем классификации. Аспект - точка зрения на объект клас­сификации, который характеризуется одним или несколькими признаками. Многоаспектная система - это система класси­фикации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная. Фасет - это аспект классификации, который исполь­зуется для образования независимых классификационных груп­пировок. Дескриптор - ключевое слово, определяющее неко­торое понятие, которое формирует описание объекта и дает при­надлежность этого объекта к классу, группе и т.д.

Фасетная система характеризуется следующими особеннос­тями построения:

имеется некоторое множество классифицируемых объектов Мо;

• это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или не­сколькими признаками, образующими фасет Фr;

• устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач):

• определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам (рис. 4.3).

 

 

Внутри фасета значения признаков могут просто перечислять­ся по некоторому порядку или образовывать сложную иерархи­ческую структуру, если существует соподчиненность выделенных признаков.

К преимуществам данной системы следует отнести большую емкость системы и высокую степень гибкости, поскольку при не­обходимости можно вводить дополнительные фасеты и изменять их место в формуле. К недостаткам, характерным для данной си­стемы, можно отнести сложность структуры и низкую степень заполненности системы.

Согласно идее координатного индексирования предполага­ется, что содержание документов или показателей можно дос­таточно полно и точно отразить с помощью списка ключевых слов - дескрипторов. Дескриптор - это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения. Например, показатель «Количество продукции, выработанное фактически цехом за смену», записанный на естественном языке, при исполь­зовании метода координатного индексирования будет иметь вид: «количество, продукция, выработка, фактический, цех, смена».

Большое значение для построения дескрипторного языка име­ют выявление и фиксирование ассоциативных отношений между терминами, которые позволяют выдавать более точные ответы на запросы пользователей. К числу ассоциативных отношений относят такие, как отношение части к целому (например, «цех» -«участок»), причинно-следственные отношения (например, «про­гул» - «невыполнение»), связи предмета и процесса (например, «план» - «планирование») и др.

 

Для полной формализации экономической информации недо­статочно простой классификации, поэтому проводят следующую процедуру - кодирование. Кодирование - это процесс присвое­ния условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов. Код - это условное обозна­чение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определен­ном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код характеризуется следующими параметрами:

• длиной (L);

• основанием кодирования (А);

• структурой кода, под которой понимают распределение зна­ков по признакам и объектам классификации;

• степенью информативности (I), рассчитываемой как частное от деления общего количества признаков (R) на длину кода (L):

I=RIL

• коэффициентом избыточности изб), который определяется как отношение максимального количества объектов (Qmax) к фактическому количеству объектов (Qфакт ):

Кизб= Qmax / Qфакт

Все системы кодирования можно сгруппировать в два под­множества (рис. 4.4): регистрационные и классификационные системы кодирования.

Особенностью регистрационных систем кодирования являет­ся их независимость от применяемых систем классификации. Ре­гистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальноcти длины кода, однозначности соответствия наименования объек­та и его кода в течение длительного периода времени и защищен­ности кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информаци­онной и контрольной, предназначенной для защиты передавае­мой информации от ошибок. Контрольная часть может рассчи­тываться по различным алгоритмам, в частности, наиболее упот­ребляемыми являются следующие формулы их расчета:

K= M-[ ∑ Xi / M]

K= M-[ ∑ Xi ∙Bi / M]

 

где М - модуль (простое число, делящееся на единицу и на само себя); Хi - информационные разряды, i - номер разряда; Вi - вес информационного разряда.

К регистрационным системам относятся порядковая и серий­ная системы кодирования.

Порядковая система - это наиболее простая по своему пост­роению система кодирования, суть использования которой зак­лючается в последовательном присвоении каждому объекту ко-

дируемого множества Мо номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов Этот порядок может быть случайным или определяться после предва­рительной группировки объектов, например по алфавиту.

Как правило, порядковую систему применяют для кодирова­ния малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая) система кодирования отлича­ется от порядковой тем, что номенклатура кодируемых объектов Мo предварительно должна быть разбита на группировки по од­ному признаку, и каждой группировке должна быть отведена се­рия кодовых обозначений, в пределах которой каждому элемен­ту присваивается свой код по порядку. Серия обозначений для каждой группировки определяется таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классифи­кационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ, отсюда вытекают требования: однозначно­сти отображения классификационных взаимосвязей объектов и их группировок и обеспечения максимальной простоты программи­рования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использова­ния которой коды нижестоящих группировок образуются путем добавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы класси­фикации и коды группировок по фасетам формируются незави­симо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной системы ко­дирования.

Разрядная система применяется для кодирования объектов определяемых несколькими соподчиненными признаками, ис­пользуемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе ко­дирования имеет место так называемое «зависимое» кодирова­ние. Это значит, что классификационные группировки по млад­шим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и зна­чением определенного числа в структуре кода. Длина кода зави­сит от числа ступеней классификации, от числа классификацион­ных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми пре­имуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характери­зуются многими соподчиненными или независимыми признака­ми. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки ин­формации при использовании какой-либо системы.

 

 




Поделиться с друзьями:


Дата добавления: 2014-01-14; Просмотров: 732; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.