КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Принцип роботи OCR-систем
TWAIN. Сканери, загальні принципи. Сканування та розпізнавання тексту Сканер освітлює документ, а його світлочутливий давач з певною частотою проводить вимірювання інтенсивності відбитого світла. Дозволяюча спроможність сканера прямо пропорційно частоті замірів. Величина інтенсивності відбитого світла перетворюється у двійковий код, який передається на комп’ютер для подальшої обробки. В залежності від щільності блоків однієї вибірки сканера може розпізнавати більшу чи меншу кількість відтінків від чорного до білого. Кольорове сканування – це сканування в «сірому режимі» із різними фільтрами(червоним, синім, зеленим).256 відтінків кожного з компонентів в сумі дають 16,7 млн. можливих комбінацій, тобто кольорів.(24-бітове відображення). Здавалост би 24 біти достатньо для точного передавання будь-якого відтінку. Але при використанні гамм, яскравості та контрастності, розмір палітри значно зменшується, особливо по краям спектру, частина кольорів втрачається. Тому вже використовуються моделі із глибиною кольору 30,36 і навіть 48 бітів(CanoScan Lide35). Для повноцінної роботи сканера потрібна відповідна програма, чи драйвер. Зоб не писати програму для кожного типу сканера, з’явився стандарт TWAIN, у відповідності з яким здійснюється обмін між прикладною програмою і пристроєм. Будь-яка TWAIN-сумісна програма буде стабільно працювати з будь-яким TWAIN-сумісним сканером. Більшості програм оптичного розпізнавання символів (Optical Character Recognition - OCR) Власне процес розпізнавання зображення документа починається з виявлення тексту, що являє собою набір елементарних зв’язаних областей (букв), що мають приблизно однаковий розмір і розташовані на площині вздовж паралельних прямих. Після розпізнавання текстового блока він розбивається на рядки. Це не така проста задача, оскільки на практиці неминуче має місце перекіс зображення сторінки. Навіть невеликий нахил приводить до того, що лівий край біжучого рядка опиняється нижче правого краю наступного рядка, особливо при маленькому міжрядковому інтервалі. В зв’язку з цим виникає задача, до якого з двох рядків віднести даний елементарний фрагмент зображення - зв’язану область. Зв’язана область - це не обов’язково буква. Наприклад, i та j складаються з двох елементарних фрагментів, крім цього, кожна буква може опинитись розірваною на декілька елементарних областей в результаті дефектів друку та сканування. Тобто, якщо десь між двома рядками опинилась окрема зв’язана область, це може бути відірвана частина букви верхнього рядка, або крапка над i, або частина букви нижнього рядка. Після розпізнавання рядків відбувається їх розбиття на слова. На перший погляд достатньо проаналізувати відстань між сусідніми символами (зв’язаними областями) в рядку, вибрати порогову величину, і якщо відстань між сусідніми символами перевищує це значення, рахувати, що в цьому місці є пробіл. Однак на практиці мають місце і такі помилки, як “злипання ” різних слів і розрив одного слова. Тому дуже часто відмовляються від єдиного порогового значення для всього рядка і проводиться обчислення локального порога по відношенню до декількох сусідніх символів. І, нарешті, необхідно вирішити задачу розпізнавання символів. Вона ускладнюється тим, що в зв’язку з непродрукуванням символів та їх злипанням в слові неможливо знайти окремі символи без застосування різних способів розпізнавання.
Дата добавления: 2014-12-23; Просмотров: 537; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |