Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Класифікація методів розпізнавання




Різна природу кожного застосування, його специфічні вимоги та обмеження є деякими причинами того, чому існує так багато різних підходів до розпізнавання об'єкта. Не існує "схеми загального використання", яка би могла бути застосована у всіх ситуаціях, просто через великі різноманітності вимог. Замість цього, існує безліч різних підходів, кожен з них спроектований для специфічних потреб в спеціальній галузі застосування.

Тим не менш, класифікація методів і їх режим роботи може бути зроблено за допомогою деяких критеріїв. Деякі з цих критеріїв відносяться до властивостей моделі даних, що представляють об'єкт, інші – режиму роботи схеми розпізнавання. Перш ніж декілька схем буде обговорено більш детально, визначимо деякі критерії як такі:

· Представлення об'єкта: в основному, існує два способи в який інформація про об'єкт може бути сприйнята: геометрія або зовнішній вигляд. Інформація про геометрію часто посилається на межі об'єкта або його поверхню, тобто форму чи силует об'єкта. Інформації про форму об'єкта є часто головною, тобто інформація про положення форми елементів прикріплюється до однієї системи координат об'єкту. Створена модель часто робиться людьми, наприклад, за допомогою програмного пакету для малювання CAD. На відміну від цього, моделі по зовнішньому вигляду виводяться із отриманих форм регіонів характеристики зображення, які займає об'єкт. Створення моделі зазвичай робиться на підготовчій фазі, в якій система будує модель автоматично за допомогою одного або декількох пробних зображень. Тому представлення даних, як правило, зосереджені з місця спостереження, і в такому випадку це означає, що дані залежить від точки спостереження камери в процесі формування зображень.

· Обсяг даних об'єкта: модель даних може звернутися до місцевих властивості об'єкта (наприклад, положення кута об'єкта) або глобальних характеристик об'єкта (наприклад, площа, периметр, моменти інерції). У разі місцевих даних, модель складається з кількох розділів даних, що надходять з різних областей зображення, які охоплюються об'єктів, у той час як глобальні представлення об'єктів часто різні, а глобальні функції зведені в загальний вектор функції. Це уявлення часто підходять тільки для "простих об'єктів" (наприклад, кола, хрести, прямокутники і т.д. в 2D або циліндри, конуси в 3D-випадку). На відміну від цього, місцевий підхід зручний, особливо для більш складних і високо структурованих об'єктів. Типовим прикладом є промислові частини, де об'єкт може бути описаний геометричним розташування примітивів, таких як ліній та кутів. Ці примітиви можуть бути змодельовані і бути шукані на місці. Використання локальних даних допомагає досягти інваріантності по відношенню до закриття об'єкта, так як кожна локальна характеристика може бути виявлена окремо; якщо деякі з них відсутні через закриття об'єкта, інші характеристики повинні бути достатніми для розпізнавання.

· Очікувана зміна об'єкту: іншим критерієм є відмінність різних особин одного і того ж об'єкта класу, які можуть проявлятися. У промисловості існує дуже мало внутрішньокласова відмінність, тому жорстка модель може бути застосована. На протилежній стороні є схеми визнання, що дозволяють значну деформацію між різними екземплярами одного об'єкта класу. В загальному дизайн алгоритму розпізнавання повинен бути оптимізований так, що він є надійним по відношенню до внутрішньокласової зміни (наприклад, запобігання алгоритму для класифікації об'єктів пошуку в якості фону як помилка) ще будучи чутливим до міжкласових змін і тим самим зберігаючи здатність розрізняти між об'єктами для пошуку інших об'єкти. Це складає баланс, якого роду інформація повинна бути відкинута і який вигляд повино бути ретельно вивчено за допомогою алгоритму. Зверніть увагу, що внутрікласова зміна може також виходити від змін умов у процесі формування зображення, такі як освітлення або зміна положення спостереження.

· Якість зображення даних: якість даних також має значний вплив на алгоритм проектування. У промислових застосуваннях часто можна спроектувати систему спостереження, такої, що вона вироблятиме високоякісні дані: низький рівень шуму, з відсутністю перешкод та різноманітних завад (тобто без "тривожної" інформації в області фону, наприклад, тому, що об'єкти представлені на однорідному фоні), добре продумане освітлення, і так далі. На відміну від цього, наприклад, в системах відеонагляду для переповнених громадських місць алгоритм повинен впоратися із галасливими і хаотичними даними (багато інформації на фоні), погане і змінне освітлення (погодні умови), значні спотворення об'єктиву.

· Відповідність стратегії: для того, щоб визнати об'єкт в сцені образу відповідний крок повинна бути виконаний в певний момент в алгоритмі, тобто модель об'єкта (або його частина) повинні бути приведені у відповідність із змістом зображення сцени так, що або міра подібності між моделлю і зображенням сцени збільшено або міра несхожості зводиться до мінімуму, відповідно. Деякі алгоритми намагаються оптимізувати параметри перетворення, що характеризує відносини між моделлю та її проекцією на площину зображення сцени зображення. Зазвичай афінні перетворення використовується. Інший підхід полягає у знаходженні найкращого підбору шляхом пошуку відповідностей між рисами моделі та характеристики взятими зі сцен зображення.

· Обсяг даних елементів, використовуваних у підборі: дані зазвичай використовуються різними методами на їх етапі підбору, наприклад, для розрахунку міри подібності, можна умовно розділити на три категорії: сировина інтенсивності значення пікселів, низьким рівнем функцій, таких як крайові дані, і високим рівнем функцій, таких як лінії або дуги кола. Навіть поєднання ліній і/або конусів використовується. Оскільки крайові дані беруться до уваги, то межі об'єкта часто позначаються швидкими змінами інтенсивності сірого коліру, наприклад, якщо яскравий об'єкт зображений на темному фоні. Місця таких високих градієнтів сірого коліру можуть бути виявлені за допомогою відповідного оператора, наприклад, детектором країв Canny і часто називають "краєм пікселів". На наступному етапі ці крайові пікселі можуть бути згруповані у вже згадані високого рівню функції, наприклад, лінії, які можуть бути згруповані знову. Очевидно, що сфера застосування даних збільшується при переході від інтенсивності пікселів на високому рівні функцій, наприклад, групи ліній. Розширена сфера останнього призводить до збільшення вмісту інформації, яка приймає рішення на основі цих даних більш надійною. З іншого боку, однак, на високому рівні функції є більш важкими для виявлення і тому нестійкими.

 

Деякі методи розпізнавання об'єктів представлені в подальшому курсі. Основна увага припадає саме на визнання в 2D-площинах, тобто в одній сцені зображення, що містить 2D-дані. Ця сцена зображення є сірим масштабованим зображенням. Пряме розширення до кольорових зображень можливо для деяких з методів, але не розглядаються в цьому курсі. Для більшості з схеми об'єктної моделі також складається з 2D-даних, тобто дані моделі є плоскими.

Зверніть увагу, що псевдокод практичної реалізації алгоритму може бути спрощений, неповний або неефективним в якійсь мірі, а також може трохи відрізнятися від методу, запропонованого в оригінальних статтях в цілях досягнення кращої ілюстрації і тримати їх легко зрозуміти. Основною метою є отримання більш глибокого розуміння алгоритму структури, щоб не дати 100% правильний опис всіх деталей.

Крім того, зверніть увагу, що деякі старі методи, представлені в цьому курсі, страждають від недоліків, які обмежують їх застосовність для обмеженого кола застосувань в промисловості.

Однак, через їх переваги вони часто залишаються привабливими, якщо вони використовуються в якості будівельних блоків з більш складних методів. Насправді, багато з нещодавно запропонованих схем мають намір об'єднати декілька підходів (можлива зміна у порівнянні з початковою пропозицією), щоб отримати користь з їхніх переваг. Таким чином, я впевнений, що всі методи, що будуть викладені в цьому курсі досі мають практичну цінність.




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 358; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.