Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Информационно-поисковые системы




ЭЛЕКТРОННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ (ЭСУД) И СИСТЕМЫ АВТОМАТИЗАЦИИ ДЕЛОВЫХ ПРОЦЕССОВ (САДП) ПРЕДПРИЯТИЯ

4.1. Общие понятия. Зачем нужны ЭСУД и САДП системы?

Документ – материальный носитель информации, отражающий состояние системы или принятого решения. Он обладает содержанием, юридической силой, направленностью (кому предназначено). Совокупность взаимосвязанных документов называется системой документации. Каждый документ имеет свой жизненный цикл. Жизненный цикл документа – период от возникновения до его уничтожения или передачи на хранение. Он делится на активную и неактивную стадии. На первой стадии документ используется в деловых стадиях, а на второй находится на стадии надежного хранения.

Под документооборотом понимается совокупность взаимосвязанных операций, выполняемых над документом на рабочих местах с использованием определенных методов и технологий.

Электронная форма документа (ЭФД) – страница с пустыми полями для заполнения их пользователем. Под ЭФД понимается не изображение бумажного документа, а электронная технология работы с формами, где бумажная появляется по требованию в качестве твердой копии бумажной.

ЭФД, кроме простой информации, могут содержать командные кнопки, переключатели, выпадающее «меню» и списки для выбора. Использование ЭФД дает следующие преимущества:

1. Сокращение времени обслуживания клиента за счет быстрого заполнения информации, за счет сокращения времени на запрос.

2. Повышение оперативности управления информацией за счет быстрого доступа к документам, оптимального хранения и возможности систематизации.

3. Повышение степень защищенности документов при хранении путем использования специализированных программных средств защиты информации.

4. Возможность коллективного пользования в компьютерных сетях.

5. Уменьшение затрат на обработку и модификацию и т.д.

ЭФД подразделяются на: формы, предназначенные для сбора данных и последующей статистической обработки; формы, предназначенные для сбора информации как внутри, так и вне предприятия, но требующие ознакомления и подтверждения; формы удаленного пользования по сети Internet (Web-формы). Они всегда связаны с базами данных и проходят этапы: проектирования; увязывания с источниками информации; определения формы представления (экранная, бумажная или файловая); назначения и доступа. Использование ЭФД позволяет создавать электронные картотеки документов. Электронная картотека документов – система, обеспечивающая пользователю быстрый доступ к любому документу путем удобного их хранения, систематизации и маршрутизации, разграничения доступа.

ЭФД являются основой применения современных информационных технологий, особенно Internet технологий, в электронные системы управления документооборотом предприятия (ЭСУД) и в системы автоматизации делопроизводства предприятия (САДП). Возникли такие понятия, как электронный конверт, Web документ, автоматизированные системы контроля исполнения документов с электронной почтой и т.д.

Электронный конверт – документ, доступ к которому организован секретными ключами отправителя и получателя. Для запечатывания такого конверта используются два ключа: секретный ключ отправителя и открытый ключ получателя. Из них создается общий ключ. При распечатывании электронного конверта используется уже открытый ключ отправителя и секретный ключ получателя. Они устроены так, что получается тот же общий ключ. Это удобно тем, что нет необходимости встречаться с абонентами, достаточно разослать им один и тот же открытый электронный ключ.

Автоматизированные системы контроля исполнения документов с электронной почтой применяются в малых и средних организациях с большими объемами потоков управленческой информации, характеризующейся ограниченным перечнем выполняемых, строго регламентированных деловых процессов.

На большинстве современных предприятий рано или поздно встает проблема ввода, хранения и систематизации большого объема информации: договора, приказы, финансовая и проектная документация и т.д. Они накапливаются на столах сотрудников или в файловых системах компьютеров, затрудняя поиск информации, коллективную работу над документами, согласование и соблюдение конфиденциальности. Поэтому сегодня на любом современном предприятии требуется внедрение оперативных систем, позволяющих повысить эффективность работы с документами в масштабах всего предприятия или компании. Для этой цели были созданы ЭСУД и САДП. На сегодняшний день ЭСУД современного предприятия выполняет следующие функции:

1. Объединение разрозненных документов предприятия в единую информационную систему.

2. Хранение и поиск документов.

3. Оперативное реферирование документов.

4. Нумерация версий документов.

5. Обеспечение многоуровневой защиты документов.

6. Администрирование учета и архивирования.

7. Работа с разнообразными формами документов.

8. Поддержка произвольных взаимосвязей между документами.

9. Автоматический перевод запроса на другой язык.

10. Выдача и возврат документов библиотечного типа.

Иногда эти системы называют DMS (Document Management Systems) или EDMS (Electronic Document Management Systems).

Основной частью информационного обеспечения ЭСУД является база данных ЭФД, которая становится элементом централизованной базы данных всей организации и формируется как электронный архив документов. Для управления базой данных ЭФД разрабатывается программное обеспечение, состоящее из следующих компонентов:

1. Системы управления документооборотом, реализующей администрирование, систематизацию, маршрутизацию, координацию документопотоков, контроль за обработкой и исполнением.

2. Программного обеспечения для управления хранением документов.

3. Системы экспорта и импорта, поиска документов.

4. Системы управления полномочиями пользователей.

5. Набора стандартных бизнес-приложений, используемых сотрудниками для подготовки документов и т.д.

Внедрение ЭСУД позволит организовать совместный доступ к информационному ресурсу предприятия и оптимизировать профессиональную деятельность специалистов. На рынке программного обеспечения ЭСУД организациям предлагаются системы:

«БОСС-Референт». Разработка компании «АйТи». Она является составной частью системы «БОСС», включающей, кроме этого подсистемы «БОСС-Кадровик», «БОСС-Бухгалтерия».

Система «Дело». Получила распространение в России. Разработка компании «ЭОС». Для формирования форм и отчетов система интегрирована с MS Word и MS Excel. Разработан и Web ориентированный вариант системы для работы с документами в сети Internet. Реализована интеграция с пакетом сканирования документов Fine Reader.

«Крон». Программное обеспечение разработана компанией «Анкей», предназначена для автоматизации документооборота и делопроизводства и содержит следующие компоненты: систему управления документами, обеспечивающую электронную подпись; почтовую систему, интегрированную с телексом, факсом и системой Х 400; систему регистрации и исполнения документов.

«DOCS Open/Fusion». Разработка фирмы PC DOCS, предназначена для крупных фирм. Основные компоненты:

· Хранение документов практически без ограничения объемов.

· Администрирование доступа к документам.

· Быстрый поиск с использованием высокоскоростных SQL серверов.

· Одновременная работа с бумажными и электронными документами.

· Ведение до 99 версий и 26 подверсий документов.

Использует SQL-серверы Oracle, MS SQL Server и Sybase. Поддерживает все разновидности операционных систем MS Windows и UNIX.

Кроме вышеизложенных существуют системы «DocuLive», «Panagon», «VIP Enterprise», «Documentum», «Action Metro» и т.д.

Управление современным предприятием основано на согласовании между собой информационных, материальных, финансовых и кадровых ресурсов. Одной из проблем становится координация деятельности сотрудников, выбор оптимальной тактики и стратегии управления. Последние требуют получения достоверной информации для своевременных адекватных управленческих решений. Для разрешения этой проблемы используются САДП или так называемые «Work-Flow» системы.

В основе САДП лежат следующие базовые понятия:

· Деловой процесс (Business Process) – это логически завершенный набор деловых процедур, поддерживающих структуру предприятия и реализующих его политику, направленную на достижение поставленных целей.

· Объект (Object) – информационный, материальный или финансовый объект, используемый в бизнес-процессе.

· Операция – действие, выполняемое в рамках бизнес-процесса.

· Событие – внешнее, не контролируемое в рамках процесса, действие, произошедшее с объектом (например: изменение ставки налога, поломка оборудования).

· Исполнитель – должностное лицо, ответственное за выполнение операций бизнес-процесса (например: менеджер, директор).

· Деловая процедура – неделимый логический этап делового процесса.

· Описание процесса (Process Definition) – формализованное описание делового процесса в целом и входящих в него деловых процессов. Электронное графическое представление этого процесса называется картой делового процесса.

· Данные – информация, необходимая для осуществления действия.

· Инструменты (Tools) – специализированные информационные системы, обрабатывающие информацию, связанную с работой или заданием.

САДП предназначена для решения задач разработки описаний бизнес-процессов, управления исполнением самих бизнес-процессов и интеграции приложений выполненных процессов. В составе САДП моно выделить следующие основные компоненты:

1. Методология описания деловых процессов. Самой распространенной методологией сегодня является методология направленного графа компании Action Technologies. В качестве элементарной составляющей делового процесса она рассматривает цикл, построенный между заказчиком и исполнителем работы. В цикл включены все возможные действия, которые возникают при взаимодействии двух сотрудников: например, отказ от выполнения. Цикл имеет следующие параметры: условия, время и характер завершения, стоимость. Данная методология хороша тем, что она целостная, т.е. ни одно задание не потеряется и не зайдет в тупик. К этой методологии прикладывается графический редактор, позволяющий спроектировать карту делового процесса.

2. Преобразователь методологии в конкретный автоматизированный деловой процесс (АДП-приложение). Этот модуль выступает связывающим звеном между методологией и конкретным АДП-приложением. Обычно это конвертор, который исходя из карты деловых процессов и их заданных параметров, формирует базу данных с соответствующей структурой, а также создает параметры отслеживания исполнения бизнес-правил.

3. Модуль исполнения АДП-приложения. Данный модуль взаимодействует со сформированными правилами, преобразователем методологии и исполняет их.

4. Рабочее место пользователя. Интерфейс пользователя долен включать окно входящих заданий к пользователю и окно исходящих заданий от пользователя.

Любая система типа «Work-Flow» реализуют следующие функции:

· Определение и описание деловых процессов.

· Мониторинг деловых процессов.

· Выполнение деловых процессов.

· Взаимодействие с другими «Work-Flow» системами.

· Интеграция исполняемых в процессе приложений.

На сегодняшний день на рынке программного обеспечения САДП предлагаются «Work-Flow»-продукты: «WorkRoute II», «Staffware» и «FormFlow». Одной из наиболее мощных и гибких систем является система маршрутизации заданий и документов с контролем исполнения «WorkRoute II», разработанная российской компанией «Весть». Основное назначение этой системы – создание электронных моделей деловых процессов, автоматизирующих формирование, активизацию и контроль исполнения производственных заданий. В состав комплекса входят все необходимые модули для: проверки правильности и имитации работоспособности карт бизнес-процессов; мониторинга графика выполнения работ по отдельным этапам; переделки карт процессов, по которым запущены работы; формирования пользовательского интерфейса.

Любое современное предприятие владеет информационными ресурсами, затрагивающими практически все области его деятельности: производство, поставщики и покупатели, налогообложение, законодательство, конкуренты. Они создают единое информационное пространство деятельности предприятия, которое требует хранения, регулярного обновления, поиска и анализа, принятия управленческих решений. Информационное пространство формируется из отдельных документов, переписки с партнерами, финансовых данных и т.д. Для структурированных ресурсов можно применить специализированные системы, например: бухгалтерские, банковские, торговые системы и системы планового отдела. Для неструктурированных данных нужны системы общего назначения – электронные архивы, работающие на принципах информационно-поисковых систем (ИПС).

ИПС – это система, предназначенная для хранения и поиска документов с текстовой, графической, табличной информацией по атрибутам, ключевым словам и содержанию в какой-либо конкретной области. ИПС, в отличии от других систем, имеют ряд особенностей:

· Многообразие форматов хранения информации. Микрографические форматы включают микрофильмы, микрофиши, слайды. Электронные форматы включают документы, подготовленные в текстовых процессорах, системах электронной почты, оцифрованные изображения.

· Если документы имеют большой объем, то можно хранить лишь ссылки на файл этого документа.

· Многообразие возможных условий поиска. Можно проводить поиск по атрибутам документа или по содержанию.

· Возможность использования поисковых образов документа. Поисковый образ – совокупность ключевых слов документа, описывающих смысл документа.

· Ключевые слова формируют так называемый словарь тезаурусов.

· Необходимость создания внутреннего информационно-поискового языка, в состав которого входят грамматика языка и словарь тезаурусов.

· Создание с помощью информационно-поискового языка поискового образа языка.

ИПС состоит из следующих подсистем:

1. Лингвистическое обеспечение, включающее в свой состав информационно-поисковый язык.

2. Техническое обеспечение системы, состоящее из персонального компьютера и разнообразного периферийного оборудования создания, хранения, сканирования, размножения и печати информации.

3. Информационное обеспечение, состоящее из баз данных документов, поисковых образов и тезаурусов.

4. Программное обеспечение.

В основе любой ИПС лежат всевозможные методы поиска документов. Поиск считается удачным, если пользователь нашел интересующий его документ или информацию. Результаты поиска отличаются друг от друга релевантностью (Relevant – относящийся к делу) или степенью соответствия найденного документа запросу. Точность поиска зависит от полноты запроса поиска. Она определяется тем, какая часть информации, выданной в ответ на запрос, является релевантной. Рассмотрим некоторые методы поиска информации.

Индексный или двоичный поиск применяется в основном к структурированным базам данных. Слова интерпретируются как последовательность двоичных кодов. Система двоичного поиска выбирает полное соответствие для каждого слова или цепочки слов. Это самый простой вид поиска документа по содержанию, но и самый слабый вид поиска в силу своей малой полноты.

Морфологический поиск – это поиск на знании морфологии языка, поскольку в нем есть и процессы словообразования, в ходе которых формируются родственные слова – другие части речи, например от слова «финансы» можно получить слова «Финансирование» или «финансировать».

Существуют два способа проведения морфологического поиска:

· Поиск со словарем. Словарь состоит из основ слов, ссылки от которых указывают на соответствующие наборы окончаний. При поиске поисковая система сначала наводит на основу, а затем проверяет все найденные слова на морфологическое образование. Такой поиск замедляет время поиска, но обладает высокой точностью и полнотой поиска.

· Бессловарный метод. Этот метод поиска сначала выявляет основу каждого слова и отсекает их окончания, а затем «приклеивает» их при поиске. При этом пользователю нет надобности определять, сколько букв оставить в слове, а сколько заменить «звездочкой».

Семантический (смысловой) поиск. Следующий шаг в развитии поисковых систем – это семантический поиск, основанный на построении и использовании базы знаний, с помощью которой осуществляется поиск информации на основе использования концептуальных отношений, которые не применяются при статистическом поиске. Существуют несколько способов представления знаний:

1. Применение файла синонимов, что позволяет при ответе на запрос учитывать не только термины, которые указаны в запросе, но и слова, близкие к ним по значениям и смыслу.

2. Другой способ известен как подход на основе использования лингвистических правил. При этом разработчик создает систему лингвистических правил, которые используются для анализа или грамматического разбора текстовой базы данных. Этот метод анализа определяет ключевые слова и понятия, объединяющиеся в базу знаний, которая определяет содержание базы данных конкретной предметной области, например: экономика, торговля, технология и т.д.

3. Наиболее часто используется метод, основанный на использовании ссылочных документов и, в том числе, обычных словарей и словарей терминов. Как и словарь, семантическая сеть содержит множество определений для каждого хранимого слова. Определения родственных слов и понятий связываются между собой. Значения слов, наиболее подходящих для данного поиска, могут быть выбраны самим пользователем для повышения точности поиска. Подход на основе семантических сетей объединяет статистический поиск и поиск на основе базы знаний.

Поиск по запросу на естественном языке. Этот способ поиска информации иногда называют нечетким запросом (Quorum Search). Это означает, что пользователь задает запрос в виде множества из нескольких слов, а система находит все документы, в которые входят только некоторые слова из заданного множества (например, любые семь из десяти заданных). Степень нечеткости пользователь варьирует сам, задавая либо количество одновременных вхождений, либо числовую степень близости к данному множеству.

Ранжирование результатов поиска. Ранжирование результатов поиска – это когда все документы запроса найдены, поисковая система предъявила пользователю в определенном порядке. Найденные документы «взвешиваются» на предмет близости к запросу и показываются в порядке уменьшения этой близости. Для определения степени близости к запросу (ранга) используются разные алгоритмы: общее количество слов запроса в документе, соответствие грамматических форм и т.д. Группа статистических методов основывается на расчете различных частотных характеристик: частоты вхождения слова в документ; взвешенной частоты вхождения и частоты совместного вхождения нескольких слов. При этом считается, что чем чаще встречается слово в документе, тем в большей степени документ соответствует запросу.

APRP-методы. Появились в начале 90-х годов. Основаны на индексации, связаны с поиском документов на базе результатов в области нейронных сетей, искусственного интеллекта. Они позволили сформулировать совершенно новые концепции построения систем управления неструктурированной информацией в электронном виде. Компания Excalibur Technologies разработала технологию адаптивного распознавания образов APRP (A daptive P attern R ecognition P rocessing), которая была положена в основу управления документами. Сущность метода APRP основана на двух положениях:

1. Составление бинарных представлений хранящейся информации и запросов на поиск.

2. Использование метода поиска, основанного на идеях построения нейронных сетей. При этом разница в символах равна 20%, а бинарные представления этих слов всего в одном разряде (2.5%).

Технология применения APRP методов основана на сравнении бинарных представлений (образов) запроса и информации, хранящейся в архиве. Задавая степень близости запроса и искомой информации, можно отсечь ненужный «шум» и так построить поиск, что при наличии в архиве нескольких версий документов будет осуществлен полный поиск с высокой точностью. То же касается порядка слов, наличия пробелов и ошибок в словах запроса. APRP методы могут быть применены для индексации и нечеткого распознавания изображений, видео и аудио-записей, сигналов речи и всего разнообразия мультимедийной информации. Основными особенностями APRP технологии для контекстного поиска документов являются:

· Нечеткий поиск.

· Автоматическая индексация.

· Достоверность при сложной индексации.

· Использование меньшего объема ресурсов.

· Высокая скорость поиска информации.

В конце приведем анализ ряда ИПС.

Система «Следопыт». Разработанная фирмой «МедиаЛингва» технология смыслового (нечеткого) поиска русских, английских и немецких текстов. Система ищет документы по их содержанию и обеспечивает поиск русских, английских и немецких документов. Запрос на поиск задается в виде фразы на конкретном языке. Она учитывает все формы слов запроса на основе использования бессловарной машинной морфологии и оценивает компактность их расположения в текстах найденных документов. Достигается хорошая степень ранжирования за счет учета ряда факторов.

«Следопыт» с одинаковой эффективностью производит поиск как по газетным и деловым текстам, так и по узким тематическим направлениям.

Система «Либретто». Другой функцией систем управления документов является функция реферирования документов. Эта задача возникает при работе с текстовыми базами данных, разборе электронной почты и при поиске в сети Internet. В этом случае, особенно в крупных организациях, возникает необходимость использования автоматического составления сжатых описаний содержания документов, рефератов. Поэтому фирмой «МедиаЛингво» разработана высококачественная система реферирования текстов на русском, английском языках под названием «Либретто».




Поделиться с друзьями:


Дата добавления: 2014-11-25; Просмотров: 739; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.046 сек.