Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Оценка достоверности информации АСОИУ

Для количественной оценки достоверности информации используется метод, который указывал бы на удельный вес недостоверной или достоверной информации в ее общем объеме. Вместе с тем, рассмотрение вида искажений и причины их возникновения в информации показывает, что они носят случайный, характер. Поэтому для количественной оценки достоверности информации используется теория информации, теория вероятности и методы математической статистики.

Если абсолютную достоверность информации, не имеющую искажений; принять равной единице, а количество искажений в информации выразить через вероятность их появления Р, то для оценки степени достоверности информации D справедливо, в общем виде выражение:

D =1- P. (7.1)

Вычислить вероятность появления искажений Р вполне осуществимо с помощью традиционных статистических методов.

Вероятность искажений определяется на основе статистического анализа частоты случаев появления их в информации, т.е. в общем виде вероятность искажений Р выражается уравнением:

, (7.2)

где d - число искажений; Q - объем информации.

Частота искажений d* = d/ Q по мере их увеличения все больше приближается к вероятности Р, поэтому в практических целях вероятность появления искажений Р можно с известным приближением заменить d *.

В связи с этим для количественной оценки достоверности информации целесообразно пользоваться не величиной достоверности D, а обратной величиной - недостоверностью информации, измеряемой частотой искажений в ней d *. Например, если частота искажений d * составляет 2 на 10000 знаков (d * = 2*10-4), то достоверной информацией является 9998 знаков из 10000 знаков, т.е. D = 9998 *10-4 = 0.9998 или D = 1 -Р = 1- 0,0002 = 0,9998.

Оценка достоверности информации по частоте искажений, содержащихся в ней, способствует выявлению «узких мест» в работе системы. В случае низких показателей достоверности обрабатываемой информации анализируются причины возникновения искажений и это приводит к повышению эффективности функционирования систем, о котором можно судить по отклонению фактической достоверности от нормативной.

Как было показано в первых разделах, что надежность системы определяется, как способность последних выполнять свои функции в течение определенного времени при заданных условиях. При этом центральным понятием счита­ется отказ, когда один или несколько параметров систем выходят за заданные пределы, что вызывает необходимость замены отказавшего эле­мента либо его восстановления. Надежность характеризуется рядом показателей, в частности вероятностью безотказной работы в те­чение заданного времени, средним временем безотказной работы, интен­сивностью отказов, коэффициентом готовности.

Эти показатели, достаточно глубоко отражая безотказность и ремонтопригодность, не характеризуют достоверность функциониро­вания систем с позиции появления сбоев.

Поэтому надежность применительно к АСОИУ можно также трактовать как ве­роятность получения достоверного результата в заданные сроки, а име­нно

, (7.3)

где К г - коэффициент готовности; Р Б - вероятность безотказной работы ТС в течение времени t решения задачи; Р ТС - вероятность отсутствия сбоев, приводящих к искажению вы­ходной информации.

Как правило, КГ ТС равен - 0,9...0,95, а веро­ятность безотказной работы почти на порядок выше вероят­ности отсутствия сбоев: поэтому надежность решения в основном опре­деляется параметром Р ТС, т.е. достоверностью функционирования ТС.

Однако формула (7.3) не может быть использована для оценки достоверности системы в целом, ибо не отражает надежности фун­кционирования оператора, являющегося важнейшим звеном сис­темы.

С учетом надежности оператора достоверность переработки информации в системе можно определить по следующей формуле, полагая, что часть искажений будет выявлена контролем и своевремен­но исправлена:

, (7.4)

где - вероятность достоверной переработки данных ТС; Р Ч - вероятность обнаружения искажений, внесенных в информацию оператором; , , - вероятности исправления искажений за счет человека, ТС и человека и ТС соответственно за время t, не превыша­ющее допустимое t доп; Р Ч - вероятность того, что при обработке данных человеком пос­ледний не внесет в информацию искажений.

Конечным результатом обработки информации являет­ся вычисление по заданному алгоритму определенных показателей, ко­торые сводятся в выходной документ, который отображается на экране видеотерминальных устройств или передаются по каналам связи с помощью КТС и представляются в алфавитно-цифровом виде. Следовательно, для пользователя входная и выходная информация в системе обработки - это документы, различающиеся по формам, числу реквизитов, искажения отражающих показатели, их значности. Соответственно и ошибки в информации могут быть отнесены к совокуп­ности документов одного вида, к отдельному доку­менту по его строкам, реквизитам.

Искажения информации в системе могут быть: символьными (однократными и многократными); форматными простыми (однократными и многократ­ными); форматными сложными (однократными и многократными).

Символьные искажений (СИ) характеризуют искажение символов (слов) и выражаются в переходе истинного символа, а в некотором разряде сло­ва в ошибочный, при этом разрядность (формат) слова не меняется. В реквизите одновременно могут быть искажены один и более символов, соответственно можно говорить об одно- и многократных искажениях. СИ могут появляться на любых этапах и операциях обработки - при запол­нении первичных документов, кодировании информации, первичной обра­ботке данных, передаче данных. СИ являются наиболее массовыми, ими в основном и определяется уровень достоверности ин­формации.

Форматные искажения (ФИ) – это искажение длины формата некоторой единицы информации. В отличие от СИ, ФИ поражают один реквизит, в том числе и одноразрядный (например, изменение раз­рядности в реквизите - простая ФИ), либо группу реквизитов, строк документа, пачку документов - сложные ФИ. Однократное простое ФИ - увеличение (уменьшение) длины реквизита на один разряд, многократ­ное - на два и более.

Сложные однократные ФИ в группе реквизитов - пропуск или добав­ление одного реквизита, многократные ФИ - двух и более реквизитов. Для строки документа и пачки документов можно также говорить о слож­ных строчных документных однократных и многократных ФИ. При этом кратность определяется числом пропущенных или добавленных строк доку­мента или документов определенного вида. В отличие от других видов искажений сложные ФИ приводят к изменению структуры документа и, как правило, вызывают наиболее тяжелые последствия.

Указанные выше виды искажений охватывают все информационные элемен­ты - исходные данные, информацию обработ­ки, условно постоянную информацию, которые искажаются при заполнении документов, программировании, при передаче данных по каналам связи, вводе и обработке информации, ведении массивов условно-постоянной информации.

Основными источниками искажений в системе являются: человек-докумен­талист, человек-оператор; ТС; но­сители информации; инструктивные материалы по выполнению операций об­работки.

Проведенные исследования показывают, что подавляющее большинс­тво (80..90 %) составляют СИ и простые ФИ с учетом искажения этими искажения служебной информации. Сложные ФИ, как правило, не превышают 10 %.

Распределение искажений по этапам технологического процесса обра­ботки информации и управления может существенно отличаться, что определяется видом информации, сложностью первичных документов, объ­емом вносимой в них информации и источниками ее получения, качест­вом инструкций операторам (особенно по кодированию информации), пси­хофизиологическими особенностями человека-документалиста и челове­ка-оператора, используемыми ТС, достоверностью их функционирования.

Ориентировочно для типового процесса без использования аппаратуры передачи данных доля внесенных искажений на этапе заполнения первичных документов может сос­тавлять 5...30, на этапе регистрации данных 68...94, на этапе обработки 1...2 %.

В среднем искажения из-за КТС, как пра­вило, не превышают нескольких процентов общего количества искажений информации.

Известно несколько показателей достоверности обработки информации в системе. Выбор показателя оценки во всех случаях зави­сит от того, для каких целей данный показатель предполагается исполь­зовать. Показатель достоверности должен обеспечивать определение уровня искажений в информации сравнение различных спо­собов технологии обработки информации, определение числа искажений в задан­ном объеме информации (что необходимо для оценки длительности их исп­равления) оценку распределения искажений в некотором объеме информации.

Наиболее глубоко вопросы оценки достоверности информации раз­работаны в теории передачи информации по каналам связи. Поскольку искажения носят случайный характер, что справедливо как для передачи информации, так и для других этапов преобразования информации, наиболее распространенным для оценки достоверности является вероятностный по­казатель, в частности вероятность искажения двоичного символа:

, (7.5)

где n 0 - число искаженных двоичных символов; N 0 - общее число переданных двоичных символов.

Указанный показатель используется для оценки досто­верности обработки информации и на других этапах, однако для поль­зователя этого показателя явно не достаточно. Кроме того, на важнейших этапах обработки - при запол­нении первичных документов, регистрации данных, а также при выпуске работ, не говоря уже о принятии решения, информация представляется, как правило, в алфавитно-цифровом виде. Поэтому по ана­логии с передачей данных правомерным представляется использование в качестве показателя достоверности вероятности Ра искажения алфавитно-цифровых сигналов (АЦС), ли­бо противоположного ему показателя Р ба = 1- Ра:

, (7.6)

где n а - число искаженных АЦС; N д - общее число обработанных АЦС.

Предлагалось также использовать показатель К д = lg1/ P 0, причем К д = 1...10. Однако как К д, так и Р ба не получили широкого распро­странения: первый - из-за логарифмического характера и отсутствия наглядности в сравнении различных вариантов обработки, второй - из-за известного неудобства записи.

Показатель Р а (либо Р ба) не всегда отвечает сфор­мулированным выше требованиям, а прямое перенесение разработанных для двоичной информации принципов оценки в область переработки ал­фавитно-цифровой информации оказывается невозможным по причине наличия алфавита с гораздо большей длиной, неравновероятности появления различных искажений цифровом разряде даже при равной вероятности любых символов, появление на подготови­тельных этапах обработки специфических ошибок человека.

Отсюда следует, что для оценки достоверности обработки инфор­мации необходимы дополнительные показатели, более полно учитыва­ющие субъективные ошибки. Из таких показателей весьма удобными пред­ставляются: вероятность искажения реквизита Р РК, вероятность искажения строки документа Р СД и документа в целом Р ДК. Разумеется, при вероятностной оценке достоверности единиц информации крупнее АЦС необходимо указывать объем соответствующей информации, а сопостав­ление характеристик достоверности производить с учетом объема инфор­мации (длины реквизитов).

На основе показателя Р РК достаточно просто найти вероятность ис­кажения строки документа, а также приближенно вычислить и вероятность искажения документа в целом. Для сравнительной оценки эффективности различных мероприятий по повышению достоверности, определения уровня искажений в некотором объеме N а инфор­мации предлагается использовать вместо показателя Р а вероятность искажений Р и (любого вида) - число искажений всех видов в объеме информа­ции, отнесенное к одному АЦС, т.е.

. (7.7)

При оценке качества различных методов контроля иногда требуется введение и не­которых других показателей, характеризующих искажения определенных видов в реквизитах, строках документа (например, перестановка сим­волов в реквизите, перестановка чисел в строке документа.

В качестве показателя достоверности используют вероят­ность Р е искажения некоторой единицы информации (ЕИ). Указанный параметр позволяет поми­мо оценки уровня искажений ЕИ сравнить различные варианты обработки, выявить «узкие места», где значение Р е выше среднего, определить число n е искаженных ЕИ, которые потребуют корректировки (n е =N е Р е), найти ориентировочное значение вероятности искажения объема данных из N е единиц информации.

В некоторых случаях показатель Р е целесообразно дополнять рас­пределением R (N) длины неискаженного интервала, в частности для оценки вероятности искажения заданного объема N е при использовании методов контроля, эффективность которых одинакова для всех видов искажений. Независимо от вида ЕИ показатель Р е определяется с учетом объема единицы информации.

Доверительные границы для Р е могут быть найдены для большего числа наблюдений (несколько сотен и тысяч) по формулам:

, (7.8)

где - частность искажения ЕИ в эксперименте; t 2 – постоянный параметр, который определяет (для нормального закона распределения) число среднеквадратичных отклонений вправо и влево от центра рассеивания; при этом вероятность попадания в интервал будет d.

Формулы (7.8) справедливы, когда NePe и Ne (1- Pe)>10. Если число Ne наблюдений в эксперименте мало (не превосходит нескольких десятков), вероятность искажения ровно n ЕИ будет распределена по биномиальному закону, т.е.

. (7.9)

Поскольку биномиальное распределение – несимметричное относительно центра рассеивания, доверительные границы целесообразно определять из соотношений:

(7.10)

где b=1-a - вероятность попадания частности искажения ЕИ левее и правее доверительных границ; n – число искаженных ЕИ при Ne опытах.

Основной единицей экономической информации является показатель, состоящий из реквизитов-признаков и реквизитов-оснований. Реквизиты-признаки определяют показатель качественно (например, шифры, коды, обозначающие определенные понятия), а реквизиты-основания – количественно.

Количественная характеристика показателя вычисляется по заданному алгоритму обработки с определенной точностью. Как известно, точность любой величины, в том числе и показателя, может быть охарактеризована абсолютной и относительной погрешностями, а именно:

d= А - В; e=d/А. (7.11)

 

Контрольные вопросы

 

1. Каковы принципы комплексного исследования повышения достоверности передачи и обработки информации?

2. Дайте определение достоверности информации.

3. Раскройте содержание понятия искажение информации.

4. Оцените взаимосвязь достоверности и точности обработки информации в информационной системе.

5. Поясните основную формулу оценки достоверности переработки информации с учетом надежности человека.

6. Опишите разновидности искажений информации в информационной системе.

7. Опишите вероятность искажения информации, принятую в теории передачи данных.

 

 

 

 

Глава 8. Надежность оператора АСОИУ

 

Как справедливо отметил академик А.И.Берг, проблема надёжности является вечной. Каждый этап в развитии техники по-новому ставит и эту проблему, требуя создания новых теорий и методов.

Сегодня на первый план выдвигается задача оценки надёжности систем с учетом наличия в ней человека. Это обусловлено тем, что в общей массе производственных процессов именно таким системам принадлежит наиболее значительная доля. Так, по данным технического комитета ООН, в развитых промышленных странах за последние 15 лет доля ручного труда сократилась с 76 до 8%, доля полностью автоматизированных систем возросла с 12 до 32 %, а доля тех производственных процессов, которые реализуются такими системами, возросла с 12 до 60 %.

Проблема надежности этих систем не может быть исследована в рамках только одного научного направления. Требуется системный подход, позволяющий охватить не только технические, но и психологические и социально-психологические аспекты.

Проблема надежности связана с инженерной психологией, поскольку человек в контуре системы допускает в процессе своей деятельности ошибки различного характера, то есть проблема надежности человека выросла из проблемы ошибок.

Цена человеческих ошибок особенно остро стала ощущаться сегодня. Расплата за ошибочные действия оператора, управляющего сложной системой, приводит не только к снижению показателей ее эффективности, но и нередко гибели людей. Исключительной важностью этого вопроса и объясняется постоянное внимание к нему со стороны инженерных психологов и других специалистов.

 

 

<== предыдущая лекция | следующая лекция ==>
Принципы повышения достоверности информации | Подходы к изучению надежности оператора
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 2774; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.035 сек.