КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Деякі особливості
Програмне забезпечення систем розпізнавання. Загальні вимоги. Основне призначення розпізнавальної системи,якою є OCR-система полягає в аналізі растрової інформації (відсканованого символу) і присвоєнні точковому зображенню відповідного символа. Після завершення процесу розпізнавання OCR-системи повинні вміти зберігати форматування вихідних документів, присвоювати в потрібному місці атрибут абзацу, зберігати таблиці, графіку (нерозпізнані малюнки), штрих-коди і т.п. Сучасні програми розпізнавання підтримують всі відомі текстові та графічні формати і формати електронних таблиць, а деякі підтримують такі формати як HTML і PDF. Робота з OCR-системами, як правило, не викликає особливих складностей. Більшість таких систем мають простий автоматичний режим “Scan&Read”. Крім того, вони підтримують і режим розпізнавання зображень з файлів. Однак для того, щоби досягти кращих можливих результатів, необхідно попередньо вручну настроїти її на конкретний вигляд тексту, а точніше на спосіб і якість накреслення букв та інших символів. Дуже важливим при роботі з OCR-системою є зручність вибору мови розпізнавання і типу матеріалу, що розпізнається (друкуюча машинка, факс, матричний принтер, газета, та ін.), а також інтуїтивна зрозумілість користувацького інтерфейсу. При розпізнаванні текстів, в яких використовується декілька мов, ефективність розпізнавання залежить від вміння OCR-системи формувати групи мов. При розпізнаванні документів дуже важливо, щоби OCR-система могла вчитись на невпевнено розпізнаних і нерозпізнаних символах. Ця властивість особливо актуальна при розпізнаванні великої кількості сторінок одного документа - навчивши систему один раз, можна пришвидшити процес розпізнавання. Якими б ефективними не були алгоритми розпізнавання, що використовуються в OCR-системі, при низькій якості зображення уникнути помилок практично неможливо. Тому необхідна перевірка орфографії розпізнаних слів. Для корекції окремих помилок слід організувати взаємодію системи перевірки орфографії та OCR-системи таким чином, щоб забезпечити підбір варіантів символів, які імовірно були розпізнані з помилкою, і таким чином добитися орфографічної коректності слова. Як правило, OCR-системи підтримують велику кількість мов, а підтримка орфографії забезпечується тільки для їх частини. При цьому важливо, щоби існувала можливість поповнення словників вручну користувачем. Кажучи про швидкість розпізнавання, можна відмітити той факт, що сучасні персональні комп’ютери (з процесорами Pentium і Celeron з тактовою частотою 500..800 MHz і оперативною пам’яттю 64 MB) виконують розпізнавання сторінки формату A4 з текстовим наповненням за 1..3 сек, а при наявності графічних об’єктів - за 20..25 сек. Тому для ефективної роботи з розпізнавання важливіша, все ж таки, точність, оскільки при неточному розпізнаванні виграш у часі буде програний за рахунок часових затрат на усунення помилок.
Дата добавления: 2014-12-23; Просмотров: 511; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |