Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Робота з програмою FineReader




Програма АВВYY Fine Reader (hhtр://www.аbbyy.rи/fiпеrеаdеr7/?раrаm=6880) - один з деяких ОСR-пакетов для розпізнавання текстів і практично єдиний, що дійсно добре підтримує кирилицю. Кожна нова версії даної утиліти завжди демонструвала більш якісне й швидке розпізнавання текстових документів з нескладними таблицями. Що ж, давайте подивимося, чим нас порадує восьма версія Fine Reader і протестуємо її можливості на практиці, зрівнявши їх з попередніми версіями програми.

Інсталяція програми

При установці в користувача не повинно виникнути ніяких труднощів. Спочатку вам запропонують вибрати мову. Потім ви виберете режим установки (повний або вибірковий) і папку, у якій будуть розміщені файли-програми. У режимі вибіркової установки ви самі, вручну, вибираєте потрібні вам компоненти для установки. У демонстраційній версії Fine Reader 8.0 Professional доступні наступні компоненти для інсталяції: мови інтерфейсу, мови розпізнавання, інтеграція з офісним пакетом Microsoft Office, демонстраційні файли й утиліта АВВYY Screen- Shot Reader. Сама ж установка програми на ПК із процесором Аthlon XP 2200+ і 512 МБ оперативної пам'яті зайняла не більше однієї хвилини.

Системні вимоги

>Процесор Intеl® Репtiиm®/Сеlеrоn®/Хеоп™, АМDК6/ Аtlоп™/ Dигоп™/ Sеmргоп™ або сумісні процесори з тактовою частотою не менш 500 Мгц;

>Операційна система Microsoft® Windows® Server 2003/XP/2000

> Обсяг оперативної пам'яті не менш 128МБ;

> Вільне місце на жорсткому диску не менш 350 МБ;

> Відеоплата й монітор з дозволом не менш 800х600 крапок;

> TWAIN-сумісний сканер, цифрова камера або факс-модем.

Огляд версій програми Fine Reader 8.0

Лінійка продуктів АВВYY Fine Reader 8.0 містить у собі п'ять різних версій програми. Один від одного їх відрізняє спосіб поширення, можливості й, природно, ціна. Ціни на АВВYY Fine Reader 8.0 коливаються в межах від 200 до 1500 гривень. Тим, хто тільки збирається купувати сканер, варто звернути увагу на комплект поставки майбутнього пристрою, тому що в комплект багатьох з них входить спрощена версія програми Fine Reader- Sprint. Отже, розглянемо більш детально кожну версію програми.

АВВYY Fine Reader 8.0 (http://www.abbyy.ru/sprint) - спрощена версія програми, поставляється в комплекті з багатьма новими сканерами й багатофункціональними пристроями (МФУ). Варто відзначити, що навіть сьогодні купивши новий сканер, у комплекті з ним може одержати застарілу версію програми (приміром, 5.0). Ця проблема вирішується відновленням через Інтернет.

АВВYY Fine Reader 8.0 Home Edition (http:// www.abbyy.ru/finereader7/?param=35898) — небагато спрощена, якщо порівнювати з Рrоfessional, версія програми. Призначено, насамперед, для домашнього використання. Благо, вартість 200 гривень злякає не всіх сучасних користувачів. Дана версія програми здатна розпізнавати нескладні документи й простенькі таблиці. Результат розпізнавання можна зберігати в розповсюджених форматах документів.

Сама цікава версія програми АВВYY Fine Reader 8.0 Рrоfessional Edition (http:// www.abbyy.ru/finereader8/?param =45006) має найбільшу кількість функцій і нововведень у порівнянні із програмами, що вийшли до восьмої редакції. Вартість даної версії становить приблизно 700 гривень. Далі буде розглядатися саме Fine Reader 8.0 Рrоfessional.

АВВYY Fine Reader 8.0 Corporate Edition (http:// www.abbyy.ru/finereader8/?param =45010) — корпоративна версія програми вартістю порядку 1500 гривень. Вона призначена для використання в локальній мережі в поліграфічних і видавничих організаціях, а також в інших компаніях, що активно працюють із текстовими документами/таблицями. Програма має потужні можливості для роботи в локальній мережі.

АВВYY Fine Reader IXI (http:// www.frakturschrift.com/) - унікальна розробка компанії. Має можливості Соrроrаtе Еdition, а також здатна розпізнавати стародавні європейські шрифти. Програма здатна розпізнавати такі шрифти, як Frаktur, Schwabacher і велика кількість готичних шрифтів з урахуванням особливостей орфографії й міфології того часу. Ціна на дану версію Fine Reader не відома, тому що це по істині унікальна розробка, і кожний її покупець теж буде унікальним.

Принципові нововведення в Fine Reader 8.0 Рrоfessional

Часто (а в деяких користувачів - майже завжди) трапляються ситуації, коли потрібно ввести й розпізнати великий обсяг тексту зі сканера або МФУ в комп'ютер. Відомо, що раніше для більш-менш якісного розпізнавання тексту ОСR системи жадали від скануючої картинки якості зображення не менш 300 крапок на дюйм (dpi). Час сканування аркуша формату А4 з такою якістю в середньому становило ледве більше однієї хвилини (значення залежить від якості сканера і його продуктивності). Таким чином, тільки на сканування, приміром, 100-сторінкової книги, піде більше півтори годин. Тепер Fine Reader здатний розпізнавати зображення з мінімальною якістю від 200 крапок на дюйм. Так, відтепер на уведення в ПК однієї сторінки формату А4 піде не більше хвилини, а в надшвидкісних сканерах - менш 30 секунд. Варто відзначити, що зниження вимог до якості зображень дозволяє програмі без особливих труднощів розпізнавати текст зі знімків фотокамери (починаючи від двохмегапікселів). Компанія АВВYY завіряє, що нова версія програми Fine Reader на 30% краще розпізнає повідомлення з факсу, зі сканера - на 15%, а із цифрової фотокамери - на 40%.

Серед інших нововведень варто відзначити вищезгадану підпрограму для навчання користувачів, інтеграцію з останніми версіями Мicrоsоft Wоrd, і трохи незвичайну підпрограму для розпізнавання тексту зі скринів вашого монітора.

Вбудована підпрограма "навчання на прикладах" навчить працювати з Fine Reader будь-якого користувача, не знайомого раніше із цією програмою. На вибір вам надається безліч готових прикладів роботи з різними типами документів і зображень: простого листа, багатомовний документ, книжковий розворот, факс, газета, РDF-документ, таблиця, візитна картка і т буд. Крім того, ви знайдете безліч корисних порад по різноманітних завданнях, з якими справляється Fine Reader.

Screenshot Reader - поставляється разом з Fine Reader програма (у демоверсії недоступна), призначена для розпізнавання тексту зі скринів вашого монітора. Працює вона по простому принципу: спочатку виконується знімок з монітора (дана процедура - аналог дії клавіші Рrint Screen, після чого Fine Reader "піднімає" це зображення з буфера обміну й розпізнає тексти, таблиці та інші стандартні об'єкти документів. Теж саме можна зробити й вручну, але Screenshot Reader дозволяє значно заощадити час. Про важливість підпрограми можна сперечатися, але марною її назвати не можна. По-перше, вона значно заощаджує час, по-друге, це один з деяких способів "дістати" вихідний текст захищених текстових файлів і документів.

Інтерфейс програми АВВYY Fine Reader 8.0

У порівнянні з попередніми версіями програми, інтерфейс не перетерпів яких-небудь принципових нововведень. Змінилися тільки іконки й добавився традиційний для додатків під Windows ХР перехід кольорів на панелі інструментів. Кнопка "SRаn&Rеаd”, як і колись, викликає майcтер сканування й розпізнавання текстових документів. Сам майстер такий же, яким він був в Fine Reader 7.0, без змін. Наступна функціональна кнопка "Відкрити” дозволить відкрити зображення, або ж зняти його зі сканера для наступної обробки. Кнопка "Розпізнати" відповідає за розпізнавання тексту виділеної сторінки. Щоб розпізнати відразу кілька сторінок, варто виділити потрібну їхню кількість на лівій панелі. Кнопка "Перевірити" відповідає за перевірку орфографії. І, нарешті, остання кнопка "Зберегти" викликає майстер збереження пакетів Fine Reader в інші розповсюджені формати текстових документів і зображень. Також, як основні функціональні кнопки, без змін залишилися й інші складові інтерфейсу. Як і колись, вибір мови перебуває у верхній частині вікна, список сторінок документа ліворуч, робота з документом здійснюється в основній частині програми, розділеної на три частини, для кожної з яких можна вибрати потрібний масштаб.

Практичні дослідження продуктивності програми

Методика тестування гранично прості: один документ і одна електронна таблиця зберігаються у формат РDFв двох варіантах - з фігурним і рубаним шрифтом. Після цього кожний файл розпізнається по черзі програмами Fine Reader версій 6.0, 7.0 і 8 0. Звичайно, таким способом можна оцінити тільки максимальну швидкість розпізнавання, тому що при розпізнаванні скануючого зображення можливі затримки за часом через особливості скануючого документу. Але також варто відзначити, що такий тест (з погляду продуктивності) буде більш об'єктивним, тому що якість розпізнавання сканованих документів програмою версії 6.0 і 8 0 істотно відрізняються.

В якості "піддослідного" документа виступила стаття "Технологія DVD: усе, що ви хотіли знати". Її зберегли у формат РDF два рази - зі шрифтом Аrial і Тimes. Таким чином, вийшло 2 файли, кожний - по 6 сторінок. Як бачите, при розпізнаванні ідеального (РDF) текстового документа, восьма версія АВВYY Fine Reader демонструє просто небувалу продуктивність. Вона випереджає попередню, сьому версію програми - у три, а шосту - у чотири рази. А головне, скільки часу заощаджується на розпізнаванні більших обсягів тексту, якщо одна сторінка розпізнається за секунду! Розпізнавання сканованого зображення буде тривати на 30-70% довше за часом, ніж та ж операція, зроблена з ідеальним документом у РDF-формате.

Тепер перейдемо до розпізнавання таблиць. Для приклада взятий 6-сторінковий прайс-лист зі шрифтом Аrial 11-го розміру. Оскільки всі таблиці оформляються саме в Аrial, ми не стали робити ще один РDF-файл із іншим шрифтом. Прайс-лист характеризується більшою кількістю осередків у таблиці, а також чималим обсягом тексту й цифр. При розпізнаванні програма не тільки визначає символи, але й розставляє їх у потрібних місцях у розпізнаваній таблиці. У таблиці, використовуваної для тесту було 7 стовпців, з яких тільки 5 містили текст. АВВYY Fine Reader 8.0 продемонстрував колосальний результат швидкодії, випередивши попередню версію програми в чотири рази, а шосту - у п'ять разів.

Результат, як говоритися, у наявності. Якщо АВВYY Fine Reader 7.0 у порівнянні з 6.0 став продуктивніше на 25-35%, залежно від складності документа, то програма з індексом 8.0 випереджає попередників у рази.

Безумовно, АВВYY Fine Reader 8.0 - кращий ОRС-пакет для розпізнавання текстів. Принаймні, для розпізнавання кирилиці поки нічого кращого не придумали. 179 мов, доступних для розпізнавання, 20% з яких мають словники, можливість перевірки орфографії після розпізнавання тексту, нова можливість розпізнавання зображень низької якості, - все це містить у собі АВВYY Fine Reader. Про недоліки програми можна було б говорити тільки у випадку, якби в неї були гідні конкуренти. А через брак таких, майже монопольний статус програми від АВВYY ставить її в категорію кращих. Так що, можна вважати, що явних недоліків у програмі немає.




Поделиться с друзьями:


Дата добавления: 2015-05-26; Просмотров: 538; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.019 сек.