КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Оценка достоверности информации АСОИУ
Для количественной оценки достоверности информации используется метод, который указывал бы на удельный вес недостоверной или достоверной информации в ее общем объеме. Вместе с тем, рассмотрение вида искажений и причины их возникновения в информации показывает, что они носят случайный, характер. Поэтому для количественной оценки достоверности информации используется теория информации, теория вероятности и методы математической статистики. Если абсолютную достоверность информации, не имеющую искажений; принять равной единице, а количество искажений в информации выразить через вероятность их появления Р, то для оценки степени достоверности информации D справедливо, в общем виде выражение: D =1- P. (7.1) Вычислить вероятность появления искажений Р вполне осуществимо с помощью традиционных статистических методов. Вероятность искажений определяется на основе статистического анализа частоты случаев появления их в информации, т.е. в общем виде вероятность искажений Р выражается уравнением: , (7.2) где d - число искажений; Q - объем информации. Частота искажений d* = d/ Q по мере их увеличения все больше приближается к вероятности Р, поэтому в практических целях вероятность появления искажений Р можно с известным приближением заменить d *. В связи с этим для количественной оценки достоверности информации целесообразно пользоваться не величиной достоверности D, а обратной величиной - недостоверностью информации, измеряемой частотой искажений в ней d *. Например, если частота искажений d * составляет 2 на 10000 знаков (d * = 2*10-4), то достоверной информацией является 9998 знаков из 10000 знаков, т.е. D = 9998 *10-4 = 0.9998 или D = 1 -Р = 1- 0,0002 = 0,9998. Оценка достоверности информации по частоте искажений, содержащихся в ней, способствует выявлению «узких мест» в работе системы. В случае низких показателей достоверности обрабатываемой информации анализируются причины возникновения искажений и это приводит к повышению эффективности функционирования систем, о котором можно судить по отклонению фактической достоверности от нормативной. Как было показано в первых разделах, что надежность системы определяется, как способность последних выполнять свои функции в течение определенного времени при заданных условиях. При этом центральным понятием считается отказ, когда один или несколько параметров систем выходят за заданные пределы, что вызывает необходимость замены отказавшего элемента либо его восстановления. Надежность характеризуется рядом показателей, в частности вероятностью безотказной работы в течение заданного времени, средним временем безотказной работы, интенсивностью отказов, коэффициентом готовности. Эти показатели, достаточно глубоко отражая безотказность и ремонтопригодность, не характеризуют достоверность функционирования систем с позиции появления сбоев. Поэтому надежность применительно к АСОИУ можно также трактовать как вероятность получения достоверного результата в заданные сроки, а именно , (7.3) где К г - коэффициент готовности; Р Б - вероятность безотказной работы ТС в течение времени t решения задачи; Р ТС - вероятность отсутствия сбоев, приводящих к искажению выходной информации. Как правило, КГ ТС равен - 0,9...0,95, а вероятность безотказной работы почти на порядок выше вероятности отсутствия сбоев: поэтому надежность решения в основном определяется параметром Р ТС, т.е. достоверностью функционирования ТС. Однако формула (7.3) не может быть использована для оценки достоверности системы в целом, ибо не отражает надежности функционирования оператора, являющегося важнейшим звеном системы. С учетом надежности оператора достоверность переработки информации в системе можно определить по следующей формуле, полагая, что часть искажений будет выявлена контролем и своевременно исправлена: , (7.4) где - вероятность достоверной переработки данных ТС; Р Ч - вероятность обнаружения искажений, внесенных в информацию оператором; , , - вероятности исправления искажений за счет человека, ТС и человека и ТС соответственно за время t, не превышающее допустимое t доп; Р Ч - вероятность того, что при обработке данных человеком последний не внесет в информацию искажений. Конечным результатом обработки информации является вычисление по заданному алгоритму определенных показателей, которые сводятся в выходной документ, который отображается на экране видеотерминальных устройств или передаются по каналам связи с помощью КТС и представляются в алфавитно-цифровом виде. Следовательно, для пользователя входная и выходная информация в системе обработки - это документы, различающиеся по формам, числу реквизитов, искажения отражающих показатели, их значности. Соответственно и ошибки в информации могут быть отнесены к совокупности документов одного вида, к отдельному документу по его строкам, реквизитам. Искажения информации в системе могут быть: символьными (однократными и многократными); форматными простыми (однократными и многократными); форматными сложными (однократными и многократными). Символьные искажений (СИ) характеризуют искажение символов (слов) и выражаются в переходе истинного символа, а в некотором разряде слова в ошибочный, при этом разрядность (формат) слова не меняется. В реквизите одновременно могут быть искажены один и более символов, соответственно можно говорить об одно- и многократных искажениях. СИ могут появляться на любых этапах и операциях обработки - при заполнении первичных документов, кодировании информации, первичной обработке данных, передаче данных. СИ являются наиболее массовыми, ими в основном и определяется уровень достоверности информации. Форматные искажения (ФИ) – это искажение длины формата некоторой единицы информации. В отличие от СИ, ФИ поражают один реквизит, в том числе и одноразрядный (например, изменение разрядности в реквизите - простая ФИ), либо группу реквизитов, строк документа, пачку документов - сложные ФИ. Однократное простое ФИ - увеличение (уменьшение) длины реквизита на один разряд, многократное - на два и более. Сложные однократные ФИ в группе реквизитов - пропуск или добавление одного реквизита, многократные ФИ - двух и более реквизитов. Для строки документа и пачки документов можно также говорить о сложных строчных документных однократных и многократных ФИ. При этом кратность определяется числом пропущенных или добавленных строк документа или документов определенного вида. В отличие от других видов искажений сложные ФИ приводят к изменению структуры документа и, как правило, вызывают наиболее тяжелые последствия. Указанные выше виды искажений охватывают все информационные элементы - исходные данные, информацию обработки, условно постоянную информацию, которые искажаются при заполнении документов, программировании, при передаче данных по каналам связи, вводе и обработке информации, ведении массивов условно-постоянной информации. Основными источниками искажений в системе являются: человек-документалист, человек-оператор; ТС; носители информации; инструктивные материалы по выполнению операций обработки. Проведенные исследования показывают, что подавляющее большинство (80..90 %) составляют СИ и простые ФИ с учетом искажения этими искажения служебной информации. Сложные ФИ, как правило, не превышают 10 %. Распределение искажений по этапам технологического процесса обработки информации и управления может существенно отличаться, что определяется видом информации, сложностью первичных документов, объемом вносимой в них информации и источниками ее получения, качеством инструкций операторам (особенно по кодированию информации), психофизиологическими особенностями человека-документалиста и человека-оператора, используемыми ТС, достоверностью их функционирования. Ориентировочно для типового процесса без использования аппаратуры передачи данных доля внесенных искажений на этапе заполнения первичных документов может составлять 5...30, на этапе регистрации данных 68...94, на этапе обработки 1...2 %. В среднем искажения из-за КТС, как правило, не превышают нескольких процентов общего количества искажений информации. Известно несколько показателей достоверности обработки информации в системе. Выбор показателя оценки во всех случаях зависит от того, для каких целей данный показатель предполагается использовать. Показатель достоверности должен обеспечивать определение уровня искажений в информации сравнение различных способов технологии обработки информации, определение числа искажений в заданном объеме информации (что необходимо для оценки длительности их исправления) оценку распределения искажений в некотором объеме информации. Наиболее глубоко вопросы оценки достоверности информации разработаны в теории передачи информации по каналам связи. Поскольку искажения носят случайный характер, что справедливо как для передачи информации, так и для других этапов преобразования информации, наиболее распространенным для оценки достоверности является вероятностный показатель, в частности вероятность искажения двоичного символа: , (7.5) где n 0 - число искаженных двоичных символов; N 0 - общее число переданных двоичных символов. Указанный показатель используется для оценки достоверности обработки информации и на других этапах, однако для пользователя этого показателя явно не достаточно. Кроме того, на важнейших этапах обработки - при заполнении первичных документов, регистрации данных, а также при выпуске работ, не говоря уже о принятии решения, информация представляется, как правило, в алфавитно-цифровом виде. Поэтому по аналогии с передачей данных правомерным представляется использование в качестве показателя достоверности вероятности Ра искажения алфавитно-цифровых сигналов (АЦС), либо противоположного ему показателя Р ба = 1- Ра: , (7.6) где n а - число искаженных АЦС; N д - общее число обработанных АЦС. Предлагалось также использовать показатель К д = lg1/ P 0, причем К д = 1...10. Однако как К д, так и Р ба не получили широкого распространения: первый - из-за логарифмического характера и отсутствия наглядности в сравнении различных вариантов обработки, второй - из-за известного неудобства записи. Показатель Р а (либо Р ба) не всегда отвечает сформулированным выше требованиям, а прямое перенесение разработанных для двоичной информации принципов оценки в область переработки алфавитно-цифровой информации оказывается невозможным по причине наличия алфавита с гораздо большей длиной, неравновероятности появления различных искажений цифровом разряде даже при равной вероятности любых символов, появление на подготовительных этапах обработки специфических ошибок человека. Отсюда следует, что для оценки достоверности обработки информации необходимы дополнительные показатели, более полно учитывающие субъективные ошибки. Из таких показателей весьма удобными представляются: вероятность искажения реквизита Р РК, вероятность искажения строки документа Р СД и документа в целом Р ДК. Разумеется, при вероятностной оценке достоверности единиц информации крупнее АЦС необходимо указывать объем соответствующей информации, а сопоставление характеристик достоверности производить с учетом объема информации (длины реквизитов). На основе показателя Р РК достаточно просто найти вероятность искажения строки документа, а также приближенно вычислить и вероятность искажения документа в целом. Для сравнительной оценки эффективности различных мероприятий по повышению достоверности, определения уровня искажений в некотором объеме N а информации предлагается использовать вместо показателя Р а вероятность искажений Р и (любого вида) - число искажений всех видов в объеме информации, отнесенное к одному АЦС, т.е. . (7.7) При оценке качества различных методов контроля иногда требуется введение и некоторых других показателей, характеризующих искажения определенных видов в реквизитах, строках документа (например, перестановка символов в реквизите, перестановка чисел в строке документа. В качестве показателя достоверности используют вероятность Р е искажения некоторой единицы информации (ЕИ). Указанный параметр позволяет помимо оценки уровня искажений ЕИ сравнить различные варианты обработки, выявить «узкие места», где значение Р е выше среднего, определить число n е искаженных ЕИ, которые потребуют корректировки (n е =N е Р е), найти ориентировочное значение вероятности искажения объема данных из N е единиц информации. В некоторых случаях показатель Р е целесообразно дополнять распределением R (N) длины неискаженного интервала, в частности для оценки вероятности искажения заданного объема N е при использовании методов контроля, эффективность которых одинакова для всех видов искажений. Независимо от вида ЕИ показатель Р е определяется с учетом объема единицы информации. Доверительные границы для Р е могут быть найдены для большего числа наблюдений (несколько сотен и тысяч) по формулам: , (7.8) где - частность искажения ЕИ в эксперименте; t 2 – постоянный параметр, который определяет (для нормального закона распределения) число среднеквадратичных отклонений вправо и влево от центра рассеивания; при этом вероятность попадания в интервал будет d. Формулы (7.8) справедливы, когда NePe и Ne (1- Pe)>10. Если число Ne наблюдений в эксперименте мало (не превосходит нескольких десятков), вероятность искажения ровно n ЕИ будет распределена по биномиальному закону, т.е. . (7.9) Поскольку биномиальное распределение – несимметричное относительно центра рассеивания, доверительные границы целесообразно определять из соотношений: (7.10) где b=1-a - вероятность попадания частности искажения ЕИ левее и правее доверительных границ; n – число искаженных ЕИ при Ne опытах. Основной единицей экономической информации является показатель, состоящий из реквизитов-признаков и реквизитов-оснований. Реквизиты-признаки определяют показатель качественно (например, шифры, коды, обозначающие определенные понятия), а реквизиты-основания – количественно. Количественная характеристика показателя вычисляется по заданному алгоритму обработки с определенной точностью. Как известно, точность любой величины, в том числе и показателя, может быть охарактеризована абсолютной и относительной погрешностями, а именно: d= А - В; e=d/А. (7.11)
Контрольные вопросы
1. Каковы принципы комплексного исследования повышения достоверности передачи и обработки информации? 2. Дайте определение достоверности информации. 3. Раскройте содержание понятия искажение информации. 4. Оцените взаимосвязь достоверности и точности обработки информации в информационной системе. 5. Поясните основную формулу оценки достоверности переработки информации с учетом надежности человека. 6. Опишите разновидности искажений информации в информационной системе. 7. Опишите вероятность искажения информации, принятую в теории передачи данных.
Глава 8. Надежность оператора АСОИУ
Как справедливо отметил академик А.И.Берг, проблема надёжности является вечной. Каждый этап в развитии техники по-новому ставит и эту проблему, требуя создания новых теорий и методов. Сегодня на первый план выдвигается задача оценки надёжности систем с учетом наличия в ней человека. Это обусловлено тем, что в общей массе производственных процессов именно таким системам принадлежит наиболее значительная доля. Так, по данным технического комитета ООН, в развитых промышленных странах за последние 15 лет доля ручного труда сократилась с 76 до 8%, доля полностью автоматизированных систем возросла с 12 до 32 %, а доля тех производственных процессов, которые реализуются такими системами, возросла с 12 до 60 %. Проблема надежности этих систем не может быть исследована в рамках только одного научного направления. Требуется системный подход, позволяющий охватить не только технические, но и психологические и социально-психологические аспекты. Проблема надежности связана с инженерной психологией, поскольку человек в контуре системы допускает в процессе своей деятельности ошибки различного характера, то есть проблема надежности человека выросла из проблемы ошибок. Цена человеческих ошибок особенно остро стала ощущаться сегодня. Расплата за ошибочные действия оператора, управляющего сложной системой, приводит не только к снижению показателей ее эффективности, но и нередко гибели людей. Исключительной важностью этого вопроса и объясняется постоянное внимание к нему со стороны инженерных психологов и других специалистов.
Дата добавления: 2014-01-07; Просмотров: 2817; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |