Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Завдання. Вивчення основ роботи з програмою FineReader




Вивчення основ роботи з програмою FineReader

ЛАБОРАТОРНА РОБОТА № 10

Додатки.

Дистрибутив програмного продукту WinZip v8.0

M.Т. Стринадко. Інформатика. Методичні вказівки до лабораторного практикуму. Частина 2. Чернівці. 2010. 12 с.

 

 

Мета: Вивчити процеси розпізнавання, перевірки і збереження результатів розпізнавання при введенні документів в комп’ютер за допомогою програмного продукту FineReader.

 

Вивчити методику роботи з пакетом Fine Reader 7.0.

Виконати розпізнавання, перевірку та збереження наступних документів:

простий лист;

багатомовний документ;

книжна розгортка;

документ – факс;

складна журнальна сторінка;

газетна сторінка;

PDF документ;

проста таблиця;

таблиця з неповною кількістю чорних розділювачів;

складна таблиця;

візитні картки;

робота з презинтаціями Power Point;

програмна роздруківка;

документ з декоративним шрифтом;

документ з артикулами;

фотографія документа.

Оформити звіт.

 

Матеріали та обладнання:

Персональний комп’ютер, прикладна програма FineReader, файли відсканованих документів, методичні рекомендації щодо виконання роботи.

Вказівки до роботи:

Процес введення документів в комп'ютер складається з чотирьох етапів: сканування, розпізнавання, перевірки і збереження результатів розпізнавання. Процес сканування виконується за допомогою спеціальних пристроїв – сканерів. В роботі пропонується використати попередньо підготовлені скановані документи.

Теоретичні відомості.

Системи оптичного розпізнавання символів (Optical Character Recognition - OCR) призначені для автоматичного введення друкарських документів в комп'ютер. ABBYY FineReader — система оптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнавати тексти, набрані практично будь-якими шрифтами, без попереднього навчання. Особливістю програми ABBYY FineReader є висока точність розпізнавання і мала чутливість до дефектів друку, що досягається завдяки застосуванню технології "цілісного цілеспрямованого адаптивного розпізнавання".

Процес введення документа в комп'ютер включає такі два важливі етапи, як: сканування та розпізнавання. На першому етапі «Сканування», сканер грає роль "ока" Вашого комп'ютера: "проглядає" зображення і передає його комп'ютеру. При цьому отримане зображення є не чим іншим, як набором чорних, білих або кольорових точок, картинкою, яку неможливо відредагувати ні в одному текстовому редакторові. Розпізнавання, або обробка зображення OCR-системою, включає аналіз графічного зображення, переданого сканером, і розпізнавання кожного символу. Процеси аналізу макету сторінки (визначення областей розпізнавання, таблиць, картинок, виділення в тексті рядків і окремих символів) і розпізнавання зображення тісно зв'язані між собою: алгоритм пошуку блоків використовує інформацію про розпізнаний текст для точнішого аналізу сторінки.

Як уже згадувалося, розпізнавання зображення здійснюється на основі технології "цілісного цілеспрямованого адаптивного розпізнавання".

Цілісність - об'єкт описується як ціле за допомогою значущих елементів і зв’язків між ними.

Цілеспрямованість - розпізнавання будується як процес висунення і цілеспрямованої перевірки гіпотез.

Адаптивність - здібність OCR-системи до самонавчання.

Відповідно до цих трьох принципів система спочатку висуває гіпотезу про об'єкт розпізнавання (символ, частину символу або декількох склеєних символів), а потім підтверджує або спростовує її, намагаючись послідовно виявити всі структурні елементи і зв’язки. У кожному структурному елементі виділяються частини, значущі для людського сприйняття: відрізки, дуги, кільця і точки. Слідуючи принципу адаптивності, програма самостійно "настроюється", використовуючи позитивний досвід, отриманий на перших упевнено розпізнаних символах. Цілеспрямований пошук і облік контексту дозволяють розпізнавати розірвані і спотворені зображення, роблячи систему стійкою до можливих дефектів листа.

В результаті роботи у вікні ABBYY FineReader з'явиться розпізнаний текст, який Ви можете відредагувати і зберегти в найбільш зручному для Вас форматі.

 

Інтерфейс програми ABBYY FineReader

 




Поделиться с друзьями:


Дата добавления: 2015-05-24; Просмотров: 462; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.