Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Книжна розгортка




Багатомовний документ.

Вказівка. Використайте файл MANYLANG.TIF. Багатомовний документ – це документ, в якому на одній сторінці зустрічається декілька мов розпізнавання. Для розпізнавання даного документа необхідно вибрати декілька мов розпізнавання. Для цього: у списку мов на панелі Стандартна виберіть пункт Вибір декількох мов і в діалозі, що відкрився, Мову розпізнаваного тексту вкажіть Англійська, Французька і Німецька мови. Зауваження. Збільшення кількості підключених до розпізнавання одного документа мов може привести до погіршення якості розпізнавання. Не рекомендується підключати більше 2-3 мов.

Вказівка. Використайте файл DUALPAGE.TIF. Існують ситуації, коли за одне сканування сканується пара сторінок (книжковий розворот), при цьому кожна сторінка має свій кут нахилу, що негативно позначається на якості розпізнавання, крім того обидві сторінки зберігаються на одну сторінку в дві колонки. При розпізнаванні, зображення повинно мати стандартну орієнтацію: текст повинен читатися зверху вниз, і рядки мають бути горизонтальними. За умовчанням при розпізнаванні програма автоматично визначає і коректує орієнтацію зображення. У зображень із здвоєними сторінками стандартна орієнтація відсутня, оскільки кожна сторінка має свій кут нахилу. Рішення: У програмі існує спеціальний режим, при якому зображення із здвоєними сторінками розрізає на дві частини і перетворюється на дві окремі сторінки пакету. Це дозволяє обробити кожну сторінку: автоматично виправити кут нахилу і зберегти розпізнаний текст з кожної сторінки в окремий файл (або на окрему сторінку). Щоб встановити даний режим, перед додаванням зображення в пакет на закладці Сканувати/відкрити в групі Обробка зображень відзначте опцію Ділити розворот книги. Розрізати зображення із здвоєними сторінками на дві частини, які згодом будуть перетворені в дві окремі сторінки пакету, можна також за допомогою опції Розбити зображення.

Документ – факс.

Вказівка. Використайте файл Fax.tif. Для такого документу, як факс, характернапогана якість друку документа (багато "сміття" на зображенні, нечіткі межі букв, незграбні, нерівні букви з дефектами, перекіс рядків, зсув і неявні межі чорних роздільників таблиць). Рішення: Для підвищення якості розпізнавання даного документа його необхідно сканувати в сірому режимі. В цьому випадку вам не потрібно буде підбирати яскравість сканування - програма зробить це за вас автоматично. У разі складної структури документа також рекомендується розбивати його на блоки уручну або контролювати процес автоматичного розбиття.

Складна журнальна сторінка.

Вказівка. Використайте файл MAGAZIN.TIF. Погана якість розпізнавання характерна для випадку неправильного виділення блоків. Рішення: В результаті автоматичного аналізу даної сторінки були виділені зайві блоки (наприклад, ділянки тексту на картинці). Перевірте кількість блоків, а також відредагуйте форму виділених блоків. Для цього скористайтеся інструментами на панелі Зображення:

- щоб видалити виділені на картинці зайві блоки тексту;

і - щоб намалювати блоки не прямокутної форми;

і - щоб намалювати текстовий блок і блок-картинку.

 

Зауваження. При виділенні текстових блоків стежте за тим, щоб межі блоків збігалися з межами тексту.

Газетна сторінка.

Вказівка. Використайте файл Newspaper.tif. Опис ситуації: погана якість розпізнавання унаслідок особливостей газетного паперу (жовта, з ворсинками і ін.), "сміття" на зображенні, неправильного виділення блоків. Для підвищення якості розпізнавання газетної сторінки її рекомендується сканувати в сірому режимі. Сірий тип зображення забезпечує вищий ступінь збереження інформації про букви сканованого тексту, що приводить до поліпшення якості розпізнавання документів середньої і низької якості друку. Газетні сторінки є багатоколоночним текстом з картинками, деякі ділянки якого можуть розташовуватися поверх картинки, що іноді може привести до неправильного виділення блоків при автоматичному аналізі.




Поделиться с друзьями:


Дата добавления: 2015-05-24; Просмотров: 400; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.