Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

PDF документ




Вказівка. Використайте файл PDF.pdf. Одним з найбільш популярних форматів представлення електронних документів в Internet, архівах і так далі є формат PDF (Portable Document Format). Програма ABBYY Finereader допоможе вам розпізнати PDF документи і зберегти розпізнаний текст у вибраний вами формат або передати його в зовнішнє застосування. За допомогою ABBYY Finereader ви також можете розпізнати зображення і зберегти текст в PDF файл. Вибір типу PDF файлу залежить від того, як ви збираєтеся використовувати створений документ PDF надалі:

Тільки текст і картинки

Зберігається тільки розпізнаний текст і картинки в нім. Можливий пошук по тексту. Розмір PDF-файла невеликий. Режим оптимальний для документів з текстом і картинками на білому фоні (контракти, страхові поліси, листи, факси).

Тільки зображення

В даному файлі зберігається точне зображення сторінки. Отриманий документ невідмітний від оригіналу, але пошук по тексту неможливий. Режим рекомендується для пересилки по електронній пошті точних копій рахунків, сертифікатів і інших документів.

Текст поверх зображення сторінки

Зберігається фон і картинки первинного документа, поверх яких накладається розпізнаний текст. Даний тип PDF файлів оптимальний для документів з текстом на кольоровому фоні (рекламні буклети, брошури).

Текст під зображенням сторінки

Зберігається точне зображення первинного документа, під яким зберігається розпізнаний текст. Отриманий документ невідмітний від оригіналу, і в нім можливий пошук по тексту.

Щоб встановити режими збереження у форматі PDF:

Клацніть по кнопці Формати на закладці Зберегти в діалозі Опції (меню Сервіс>опціі) або натисніть Ctrl+shift+x.

На закладці PDF діалогу Формати встановите необхідний режим.

PDF є поширеним форматом для пересилки документів по електронній пошті або публікації документів на веб-сайтах. Природно, що при публікації на веб-сайтах дуже важлива висока швидкість відкриття документів. Документ, збережений з програми ABBYY Finereader у форматі PDF, відповідає подібним вимогам. Структура PDF така, що дозволяє відкривати в призначеному для користувача браузері для перегляду перші сторінки PDF документа, не чекаючи, коли весь файл цілком буде завантажений з веб-сервера.

Проста таблиця.

Вказівка. Використайте файл TABLE.TIF. Якщо зображення відскановане з правильними параметрами і таблиця має просту структуру (є всі чорні роздільники, таблиця не містить картинок, немає інвертованого або вертикального тексту), то її розпізнавання не вимагає установки яких-небудь спеціальних опцій.

Таблиця з неповною кількістю чорних розділювачів.

Вказівка. Використайте файл TABLESEP.TIF. Опис ситуації: всі рядки таблиці між чорними горизонтальними лініями (роздільниками) об'єднані в один рядок таблиці. Якщо в таблиці зустрічається змішане розділення на рядки і стовпці, при якому деякі рядки розділені чорними роздільниками, а деякі немає, програма може розбити таблицю на рядки неправильно. Рішення: Програму можна "змусити" виділяти кожен рядок тексту в окремий рядок таблиці. Для цього: у групі Розпізнати діалогу Додаткові опції відзначте опцію В кожному елементі таблиці не більш за один рядок тексту. Для того, щоб відкрити цей діалог, натисніть кнопку Додаткові опції на закладці Загальні в діалозі Опції (меню Сервіс>опції).

Складна таблиця.

Вказівка. Використайте файл TableDif.tif. Опис ситуації: неправильний аналіз таблиць з складною нерегулярною структурою: неправильне розділення таблиці на рядки і стовпці; неправильне виділення картинок в елементах таблиці; погане розпізнавання вертикального і інвертованого тексту. Рішення: Скористайтеся інструментами ручної розмітки таблиць, розташованими на панелі Зображення:

- щоб додати вертикальну лінію;

- щоб додати горизонтальну лінію;

- щоб видалити лінію.

Для елементів таблиці, що містять тільки картинки, в діалозі Властивості блоку (меню Вигляд > Властивості), відзначте пункт Вважати осередок за картинку.

Для виділення картинок усередині комірок з текстом в окремі блоки, скористайтеся інструментом на панелі Зображення: .

Для елементів таблиці, що містять вертикальний текст, в діалозі Властивості блоку (меню Вигляд > Властивості) в полі Напрям тексту вкажіть напрям тексту в осередку; для осередків з інвертованим текстом (світлий текст на темному фоні) у випадному списку Інверсія тексту виберіть пункт Інвертований.

Візитні картки.

Вказівка. Використайте файл CARDS.TIF. Одним з віянь нашого часу стали візитні картки. Ви отримуєте їх не тільки від партнерів по бізнесу, але і від друзів, знайомих. Звичайно, це дуже зручно - вся важлива інформація про людину сконцентрована на листку паперу невеликого формату. Але іноді лякає їх кількість, і ми витрачаємо масу часу для того, щоб їх упорядкувати, привести в систему, знайти зручний спосіб зберігання. Простий і зручний спосіб введення і зберігання візиток в комп'ютері за допомогою програми ABBYY Finereader. Всі візитки обробляються і зберігаються в пакеті програми. Використовуючи функцію повнотекстового пошуку по розпізнаних сторінках пакету, ви можете знайти потрібну візитку (при цьому пошук можливий за будь-якою розпізнаною інформацією з візитки - по назві компанії, прізвищу, телефону і так далі). Список знайдених візиток показується у вікні Пошук. Щоб відкрити візитку, виберіть запис в результатах пошуку.

Ви можете поповнювати пакет новими візитками, редагувати вже розпізнані візитки у вікні Текст. Покладіть декілька візитних карток (стільки, скільки уміщатиметься) в сканер. Увага! Візитки мають бути розкладені так, щоб в результаті була отримана "таблична структура". Між рядами і колонками має бути деяка відстань. Допустимо горизонтальне (довші сторони візиток розташовані уздовж горизонталі), або вертикальне розміщення візиток на листі, але не обидва відразу. Встановіть наступні параметри сканування: роздільна здатність- 400-600 dpi (зазвичай візитні картки містять текст, набраний дрібним шрифтом, для хорошого розпізнавання якого потрібно відсканувати документ з вищим дозволом замість звичайних 300 dpi), тип зображення - сірий або кольоровий. Натисніть кнопку 1-сканувати.

Для підвищення якості розпізнавання отримані зображення з візитками слід розділити так, щоб кожній візитці відповідала окрема сторінка пакету. В цьому випадку виправлення перекосу рядків, аналіз і розпізнавання проводитиметься для кожної візитки.

Для цього в меню Зображення виберіть пункт Розбити зображення. У діалозі, що відкрився, Розбити зображення натисніть кнопку , а потім кнопку ОК. У вікні Пакет з'являться нові сторінки: кожна сторінка міститиме зображення однієї візитки. При цьому початкове зображення (що містить декілька візиток) буде видалено з пакету.

Зауваження: Якщо зображення було поділене на візитки невірно, то спробуйте поділити зображення уручну. Для цього скористайтеся кнопками і . Щоб пересунути або видалити роздільник, натисніть кнопку Вибір роздільника -, мишею перемістите роздільник в потрібне місце. Для видалення роздільника перемістите його за межі зображення. Щоб видалити всі роздільники, натисніть кнопку . Встановіть мову розпізнавання. Якщо потрібний, встановите декілька мов розпізнавання. При цьому пам'ятаєте, що збільшення кількості підключених до розпізнавання одного документа мов може привести до погіршення якості розпізнавання. Не рекомендується підключати більше 2-3 мов. Перед запуском розпізнавання перевірте підключені на закладці Зберегти шрифти: вони повинні містити всі символи мови розпізнавання. Інакше розпізнаний текст буде неправильно відображений у вікні Текст (у словах на місці деяких букв коштують значки "?" або "?").

Натисніть кнопку 2-розпізнати.

Робота з презинтаціями Power Point.

Вказівка. Використайте файл HandOuts.tif. Одним з популярних засобів створення сучасних презентацій є програма Microsoft Powerpoint. Презентація складається із слайдів, наочно і що інформативно представляють матеріал. Слайди презентацій, як правило, роздруковуються на одному або декількох листах паперу і лунають учасникам для поліпшення сприйняття і засвоєння інформації, а також внесення якихось заміток, що виникають в ході презентації, або пояснень. Можливо, повернувшись з подібного роду презентації, ви захочете перевести роздруки слайдів, що є у вас, в електронний вигляд. Зазвичай на одному листі розташовано 3-6 кадрів презентації, розпізнавання яких може бути утруднене із-за дрібного шрифту тексту слайдів. Для підвищення якості розпізнавання документа з презентацією рекомендується: У разі дрібного шрифту відсканувати документ з вищим дозволом - 400 -600 dpi (замість звичайних 300 dpi). Після того, як зображення з презентацією відскановане, розрізати його так, щоб кожному слайду відповідала окрема сторінка пакету. Для цього в меню Зображення виберіть пункт Розбити зображення . У діалозі, що відкрився, Розбити зображення натисніть кнопку, а потім кнопку ОК. У вікні Пакет з'являться нові сторінки: кожна сторінка міститиме зображення одного слайду. При цьому початкове зображення з презентацією буде видалено з пакету. Далі ви можете обробити кожен слайд презентації окремо по аналогії з іншими документами; це можна зробити уручну або автоматично. Після того, як сторінки із зображенням кожного слайду отримані і оброблені, ви можете їх розпізнати, відредагувати і зберегти результати розпізнавання в будь-якому з підтримуваних форматів, зокрема в Powerpoint.

Програмна роздруківка.

Вказівка. Використайте файл LISTING.TIF. Опис ситуації:даний приклад має дві особливості, що впливають на якість розпізнавання:

програма передає відступи від лівого краю листа не пропусками, а за допомогою завдання відступів абзацу; при експорті в.txt лівий відступ не зберігається; деякі рядки об'єднуються в один абзац і при експорті об'єднуються в один рядок;

багато помилок при розпізнаванні конструкцій мов програмування.

Рішення:

Для розпізнавання таких документів існує спеціальна опція програми Розпізнати як форматований пропусками текст. Відзначте цю опцію в діалозі Додаткові опції в групі Розпізнати. Для того, щоб відкрити цей діалог, натисніть кнопку Додаткові опції на закладці Загальні діалогу Опції (меню Сервіс>Загальні).
В цьому випадку в розпізнаному тексті збережеться ділення на рядки; відступи від лівого краю будуть передані пропусками; кожен рядок виділений в окремий абзац, а відстані між абзацами передані порожніми рядками. Все це дозволить зберегти початкове форматування тексту при збереженні у форматі Txt.

Для хорошого розпізнавання роздруків програм потрібно встановити спеціальну мову розпізнавання. Для цього:

У списку мов на панелі Стандартна виберіть значення Вибір з повного списку мов і в діалозі, що відкрився, Мову розпізнаваного тексту виберіть пункт C++.

Зауваження. Якщо розпізнаваний програмний роздрук окрім програмної коди містить текстові коментарі, то для хорошого розпізнавання необхідно вибрати декілька мов розпізнавання: мова програмування і мова, на якій написані коментарі.




Поделиться с друзьями:


Дата добавления: 2015-05-24; Просмотров: 432; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.028 сек.