Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Документ з артикулами




Вказівка. Використайте файл NEWLANG.TIF. Опис ситуації: велика кількість помилок при розпізнаванні артикулів. При розпізнаванні програма спирається на знання про мову, вказану як мова розпізнавання. Вона використовує словник (перевіряє слова по словнику), морфологічну модель мови, правила написання тексту. При обробці текстів, неприродних конструкцій, що містять багато, наприклад, артикули, програма розпізнає їх посимвольний, не використовуючи додаткової інформації про побудову даних конструкцій, що збільшує вірогідність виникнення помилок розпізнавання.

Рішення: Перед розпізнаванням даного документа необхідно створити нову мову: артикули (Codes).

Щоб створити нову мову розпізнавання:

У меню Сервіс виберіть пункт Редактор мов... і натисніть кнопку Новий. У діалозі, що відкрився, встановите перемикач в положення Створити нову мову на основі того, що існує і виберіть мову, на основі якої Ви створюєте новий: в даному випадку Англійський.

Відкриється діалог Властивості мови.

При створенні нової мови потрібно визначити наступні параметри (всі параметри задаються в діалозі Властивості мови):

Ім'я нової мови - Codes.

У полі Алфавіт мови вказаний алфавіт мови, на основі якої Ви створюєте нову мову. Натисніть кнопку , щоб відредагувати алфавіт. У нашому випадку алфавіт мови повинен містити наступні символи:.0123456789bdfglrw

Словник, який використовуватиметься системою при розпізнаванні і перевірці розпізнаного тексту.

В даному випадку ми створимо призначений для користувача словник на основі регулярного виразу. Для цього в групі Словник встановите перемикач в положення Регулярний вираз і введіть наступний регулярний вираз:

Drg|(B[0-9][0-9]|22.5)|(L[0-9])|(F[0-9][0-9][0-9])|(W([0-9]+)). Далі слід підключити дану мову до розпізнавання: для всього документа встановите Англійську мову розпізнавання (виберіть його із списку мов на панелі Стандартна), а для колонки з артикулами - нова мова - Codes. Щоб встановити свою мову розпізнавання на колонку таблиці:

Виділіть необхідну колонку, клацніть правою кнопкою миші і в локальному меню виберіть пункт Властивості. У діалозі Властивості, що відкрився, на закладці Блок в полі Мову розпізнавання вкажіть відповідна мова розпізнаванні і в групі Застосувати до встановите перемикач в положення Виділеним коміркам.

Фотографія документа.

Вказівка. Використайте файл DemoPhoto.JPG. Опис ситуації: низька якість розпізнавання зображення.

Якість розпізнавання може бути низькою унаслідок низької якості зображення. Для успішного розпізнавання необхідні зображення хорошої якості. Зробіть нову фотографію документа, якщо:

Знімок дуже темний і неконтрастний. Рішення: Постарайтеся поліпшити освітлення. Якщо такої можливості немає - встановіть менше значення діафрагми.

Знімок нерізкий. Рішення: Можливо, автофокус погано спрацьовує через відсутність світла. Спробуйте поліпшити освітлення. Якщо це не допомагає, використовуйте ручне фокусування. Якщо нерізка тільки частина знімка - спробуйте виставити більше значення діафрагми. Знімайте з більшої відстані при максимальному оптичному збільшенні. Наводите фокус на крапку, розташовану між центром і краєм зображення.

Спалах створює перезасвічену область в центрі кадру. Рішення: Відключите спалах. Якщо немає можливості використовувати інші джерела світла, знімайте з більшої відстані.

Рядки тексту спотворюються по краях зображення. Рішення: Відзначте опцію Усунути спотворення термін в діалозі Опції на закладці Сканувати/Відкрити (меню Сервіс>опціі).

 

Вимоги до звіту.

 

Оформити звіт в електронному вигляді у.doc або.pdf форматі (). У звіт включити назву, мету, завдання, хід роботи, отримані результати, необхідні графічні зображення та висновки. Звіт надати на електронному носії.

Контрольні запитання.

Як ввести документ в компютер?

Головне вікно FineReader?

Інструментальні панелі?

Установка програми FineReader?

Установка параметрів сканування?

Аналіз макета сторінки?

Збереження розпізнаного тексту.

Література.

ABBY FineReader 8.0 Proffesijnal Edition. Справка.

ABBY FineReader 8.0 Proffesijnal Edition. Обучение на примерах.

M.Т. Стринадко. Інформатика. Методичні вказівки до лабораторного практикуму. Частина 2. Чернівці. 2010. 12 с.

www.abbyy.ru/support/index.htm. Техническая поддержка.




Поделиться с друзьями:


Дата добавления: 2015-05-24; Просмотров: 252; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.