Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

IV. Повідомлення домашнтого завдання




Сканер внаслідок сканування документа створює файл графічного формату (BMP, TIFF, JPEG, GIF, PNG). Якщо первинний документ містив текст, то файл, отриманий внаслідок сканування, не може бути відкритий програмою текстового редактора. Необхідно виконати перетворення файлу в текстовий формат. Для цього існують спеціальні програми, що називаються програмами оптичного розпізнавання тексту.

Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші, так звані, «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти. Розпізнавання символів - це складна проблема, яка вимагає для свого вирішення залучення новітніх методів дискретної математики і штучного інтелекту. Вона не вирішується простими алгоритмами. Складність реалізації не стала непереборною перешкодою для розробників, на ринку програмних продуктів пропонується декілька систем автоматичного розпізнавання, що володіють схожими функціональними можливостями. За кордоном набули найбільшого поширення програми Omnipage, Presto!, OCR Pro. Непоганою функціональністю володіють системи Textbridge і Cuneiform. У наший країні найпопулярнішою є програма,, розроблена фірмою ABBYY.

FineReader - це програма-поліглот, розробники ввели в її склад засобів розпізнавання текстів, написаних на найпоширеніших мовах світу. Вона майже не знає шрифтових обмежень, в середовищі програми можуть бути успішно оброблені тексти, набрані найрізноманітнішими шрифтовими гарнітурами.

 
 
Рис. 1 Вікно програми FineReader
 
 

 

 


Процедура обробки документів в будь-якій OCR-системі складається з наступних етапів:

 
 

Сканування. На цьому етапі сканер формує зображення (Рис. 2), яке є основою для подальшого розпізнавання. Цифрова версія документа є зображенням, яке не може бути відредаговане як текст жодним програмним засобом.

 
 
Рис. 2 Початок створення зображення програмою FineReader

 


Сегментація зображень –полягає у виділенні блоків для розпізнавання однотипної структури (Рис. 3). Програма оперує чотирма типами блоків: текст, таблиця, зображення та штрих-код. Програма може також здійснювати сегментацію самостійно: для цього слід виконати Процес – Аналіз макету.

 
 
Рис. 3 Сегментація зображення
 
 


Процес розпізнавання сканованого тексту. Натиснення кнопки Розпізнати ініціює процес розпізнавання. Перед тим слід звірити мову тексту, що розпізнається (рис. 4).

 

 
 
Рис. 4 Вибір мови при розпізнаванні тексту
 
 

 


Редагування розпізнаного тексту. Кнопка Перевірка аиконує перевірку правопису. У діалоговому вікні Перевірка відображається слово, яке не знайдене у словнику, варіанти зміни, кнопки керування процесом: Пропустити Пропустити всі, Додати, Змінити, Змінити всі.

 




Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 727; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.