Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Система оптического распознавания finereader (FR)

FR предназначена для автоматизации ввода в ПК типографских документов. Работает в среде Windows. Обеспечивает распознавание до 99,6% символов. Время обработке 1-й страницы < 1 мин.

Главное окно системы (как и все WS - приложения) включает управляющее меню, инструментальные панели и рабочее поле.

Работа в FR выполняется в три этапа: сканирование, распознавание, редактирование.

Сканирование выполняется при физически и программно установленном сканере, регистрация которого в системе выполняется через пункт Сервис / Опции / Сканер.

Для качественности распознавания перед началом работы в диалоговом окне установки сканера (пункт Scаn&Read) задаются необходимые параметры: тип изображения, формат, ориентация, разрешение и яркость.

Выполнение сканирования производится по команде: пункт Scаn&Read/ Сканирование.

После завершения процесса в рабочем окне появляются окна: "Изображение", "Крупный план" и "Текст". Полученный файл для дальнейшей обработки необходимо сохранить в формате FRF (пункт Файл/Сохранить как...).

Распознавание, т.е. формирование системой истинного образа документа, включает настройку системы на документ, разбиение документа на блоки и распознавание блоков. Настройка заключается в задании параметров распознавания (язык текста, тип и расположение) в диалоговых окнах Сервис/Опции/Распознавание и Сервис/Опции/Страница.
Разбиение документа на блоки (текстовые, табличные и т.д.), т.е. зоны, ограниченные рамками с соответствующей нумерацией выполняется автоматически или вручную командами пункта Редактор/Выделить блоки.

Распознавание разделенного на блоки документа выполняется командой Scаn & Read/Распознавание.
Во время распознавания обработанная часть выделяется цветом в окне "Изображение", а после окончания появляется окно "Текст" с содержанием документа.

Редактирование документа включает корректировку, орфографический контроль и сохранение текста. Корректировка выполняется для первичного уточнения текста командами пункта Редактор, т.е. средствами встроенного текстового редактора.

Проверка орфографии производится с помощью встроенной в FR системы Lingvo Corrector, которая позволяет находить ошибки и неуверенно распознанные слова, корректировать ненужные пробелы и т.п. Эта операция выполняется через пункт Сервис/Орфография.

Сохранение документа (пункт Файл/Сохранить как...) может быть выполнено:

для текстовых блоков - в форматах ТХТ, RTF;

для таблиц и форм - в форматах CSV, DBF, XLS.

К дополнительным возможностям FR можно отнести:

1.Обучение системы распознанию "плохих" текстов.

При хорошем полиграфическом качестве документа используется режим омнифонт (см. Сервис/Опции/Распознавание), в котором каждый символ автоматически сравнивается с имеющимся в базе данных образцами.

При некачественности сканируемого документа используется распознавание с обучением (включается соответствующий флаг в окне "Сервис/Опции/Распознавание"). При этом пользователь, просматривая документ, выделяет плохо различимые символы и объявляет их названия системе, которая использует их при дальнейшей работе.

2. Режим пакетной обработки.

Используется при вводе больших объемов однотипных документов практически без участия пользователя. Реализуется со сканером, имеющим механизм автоподачи страниц. Включается кнопкой Scan&Read на ИП. Этот режим очень удобен для подготовки табличных файлов перед вводом их в БД.

3. Распознавание форм.

Обеспечивает ввод переменной информации с однотипных документов. Здесь блоки делятся на реперные (нераспознаваемые) и распознаваемые, затем формируется шаблон:

Фамилия  
Группа  
Факультет  
Год поступления  

Набор подобных форм обрабатывается в пакетном режиме и результаты распознавания передаются в БД.

4. FR может быть встроен в интегрированный пакет Stylus Lingvo Office, реализующий законченную технологию обработки иностранных текстов: распознавание, перевод, проверка орфографии, что обеспечивает получение готового документа на необходимом языке.

 

<== предыдущая лекция | следующая лекция ==>
Основы работы с СУБД Access | III. Расчет учебного времени
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 286; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.014 сек.