КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Способи розпізнавання символів
В загальному вигляді алгоритм розпізнавання - це послідовне висунення та перевірка гіпотез, причому порядок висунення наступних гіпотез залежить від результатів перевірки попередніх. В алгоритмах розпізнавання OCR-систем кожна гіпотеза має числову оцінку або результат операції порівняння. Звичайно гіпотези висуваються послідовно, об’єднуються в список і сортуються на основі попередньої оцінки. Остаточний вибір гіпотези здійснюється в рамках контексту, із залученням, можливо, додаткових джерел знань. Найпростішим способом є порівняння розпізнаних символів з наявними шаблонами. Після розпізнавання декількох слів, OCR-система визначає основне накреслення символів і шукає відповідні пари символів тільки з цим накресленням. В деяких випадках застосовуються тільки чисельні значення частин символу (пропорції), щоби визначити новий шрифт. Це може покращити ефективність розпізнавання для інших стилів друку, наприклад, італіка або болда, що можуть бути присутні на сторінці. В середині 70-х років появився структурний підхід до розпізнавання - аналіз ознак кожного символу здійснюється без порівняння із записаним зображенням шрифту. Для того, щоби бути універсальним, алгоритм розпізнавання не повинен настроюватись на індивідуальне накреслення, а в його основі повинен лежати процес знаходження загальних специфічних особливостей символів. При структурному підході в зображенні символу ведеться пошук лише визначених форм округлостей, кутових та лінійних співвідношень, пропорцій між подовжніми та поперечними лініями, а також пробілів. Оскільки ці геометричні особливості символів зберігаються в переважній більшості типів шрифтів, цей спосіб придатний для ідентифікації всіх типів шрифтів, а не тільки деяких. Тому цей спосіб називається омні-шрифтовим (всешрифтовим). OCR-програми, що використовують його, містять різні експертні системи, які в дійсності є тільки алгоритмами ідентифікації визначеної кількості різних символів: верхнього та нижнього регістрів, записи чисел та символів пунктуації.
Кожна з цих експертних систем шукає особливості накреслень типу “острів”, “напівострів”, крапок, прямих, дуг. Експертні системи також розглядають горизонтальні та вертикальні проекції відтисків букви і звертають увагу на основні особливості в створенні кривих, підраховуючи в них кількість темних крапок. Крім того, при реалізації структурного способу розпізнавання OCR-систему можна навчити здатностям розпізнавання: неправильно визначені символи виправляються користувачем і автоматично заносяться у вбудований словник, а програма враховує набуті знання в майбутніх процесах розпізнавання. Такий спосіб особливо актуальний при розпізнаванні рукописного тексту. Однак, незважаючи на можливості навчання та омні-шрифровість, OCR-програми справляються не з всіма особливостями типографського друку. Тому існують і способи розпізнавання, розроблені на основі аналогії з людським мозком, принцип функціонування якого базується на нейронних мережах. В нейронних мережах обробка інформації відбувається у відповідності із законами нечіткої логіки. Ця логіка враховує той факт, що в міркуваннях використовуються такі вербальні поняття, як “досить”, “майже” або “значно”, а не конкретні числові значення. Результати дослідження “експертів” нижчого рівня, що застосовуються при аналізі ознак, спочатку перетворюються в нечіткі, так звані лінгвістичні змінні, над якими і виконуються подальші операції. Точність визначення символу можна представити у вигляді функції належності, яка змінюється в діапазоні від 0 до 1. Якщо декілька таких нечітких величин, які можуть бути отримані з різних експертних перевірок, пов’язати між собою операторами логіки, то імовірність правильного заключення підвищується. І нарешті, якщо програма розпізнавання повинна наближатись до якості сприйняття тексту людиною, вона, скоріше за все, може використовувати алгоритм, що застосовує людина при читанні. Читаючи речення, людина впізнає букви, сприймає слова, зв’язує їх в синтаксичні конструкції та розуміє зміст речення. Звичайно, OCR-системи поки що так не працюють, але після розпізнавання окремих символів та цілих слів вони виконують орфографічну перевірку, підвищуючи точність розпізнавання.
Дата добавления: 2014-12-23; Просмотров: 712; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |