КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Вимоги та обмеження
Кожне застосування вимагає різні вимоги і обмеження на завдання по розпізнаванню об'єкта. Декілька категорій зазначені нижче: · Час оцінки: особливо важливий в промисловому виробництві, де дані повинні бути опрацьовані в реальному режимі часу. Наприклад, системи спостерігання для машин, які розкладають електричні SMD компоненти мають визначати позицію специфічного компонента за 10-15 мс для забезпечення високу швидкість виробництва, що являється головною особливість цих машин. Звичайно, що час для оцінювання сильно залежить від кількості пікселів, які покривають об'єкт, а також від розміру поверхні, яку потрібно обробити. · Точність: у деяких застосуваннях положення об'єкта повинна бути визначена дуже точно: оцінка похибки не повинні перевищувати частку пікселя. Якщо об'єкт, який повинен бути виявлений має достатню структурну інформацію, то субпіксельна точність можлива, наприклад, системи спостерігання та розміщення в SMD машинах здатні розміщувати об'єкти у відповідне положення з абсолютної похибки до порядку 1/10 пікселя. Знову ж таки, кількість пікселів є визначальним фактором: очевидно, чим більше пікселів покриваються об'єкт, тим більше додаткової інформації можна отримати і таким чином більш точніше компонент може бути розташований. На етапі розробки системи розпізнавання, компроміс між швидким і точним визнання має бути знайдене, коли вказується розширення в пікселях для системи камери. · Надійності визначення: звичайно, всі методи намагаються знизити темпи "помилкових тривог" (наприклад, правильні об'єкти були помилково класифіковані як "дефект") і "помилкових спрацьовувань" (наприклад, об'єктів з дефектами помилково класифіковані як "правильні"), наскільки це можливо. Але в загальному є більше тиску для запобігання невірної класифікації в промислових застосуваннях і таким чином дозволяє уникнути дорогих помилок виробництва в порівнянні, наприклад, класифікація баз даних зображень. · Інваріантність: практично кожен алгоритм повинен бути нечутливим до деяких змін об'єкта, який повинен бути виявлений. Якщо такої зміни не відбувається, тобто поява об'єкта в кожному зображенні є ідентична, то очевидно, що задача визначення буде тривіальною. Розробка алгоритму повинна бути спрямована на збільшення чутливості по відношенню до розбіжності інформації між об'єктами різних класів (міжкласова розбіжність) при мінімізації чутливості по відношенню до різної інформації між об'єктами того ж класу (внутрішньокласова розбіжність) в той же час. Різниця може бути введена з допомогою процесу отримання зображень, а також самих об'єктів, так як зазвичай кожен з об'єктів класу трішки відрізняється від інших особин того ж класу. Залежно від застосування, має сенс для досягнення інваріантності по відношенню до (див. також Рис.1.3):
ü Освітлення: сіра шкала інтенсивності масштабу об'єкта залежить від якості освітленості, кута і коліру. Загалом, об'єкт повинен бути визнаний незалежно від зміни освітлення. ü Масштаб: серед інших, площа пікселів, які покриті об'єктом дослідження, залежить від відстань від об'єкту до системи отримання зображень. Алгоритми повинні компенсувати зміни масштабу. ü Обертання: часто, обертання досліджуваного об'єкта не можна знайти на перед і повинно бути визначено самою системою.
Рис. 1.3. Приклади зміни зображень, які могли би трапитися на зображені картини, яка містить об'єктом. що повинен бути розпізнаний (всі малюнки показують ту саму іграшкову няню): (1) шаблон образу іграшкової няні; (2) зміщений, перевернутий та зменшений варіант шаблон-образу; (3) нелінійна зміна освітлення, яка викликала світлу пляму; (4) зміна кута спостереження; (5) часткове закриття об'єкту для розпізнавання; (6) зміна масштабу та частковий безлад. ü Безлад на фоні: особливості природні зображення не показують тільки об'єкт, але також містять інформацію про фон. Цей фон може істотно відрізнятися для того ж об'єкта (наприклад, абсолютно не відноситися до об'єкту) і бути добре структурованим. Тим не менш, зміна фону не повинно впливати на розпізнавання об'єкту. ü Часткова закритість: іноді система не може покладатися на те, що весь об'єкт показаний на зображенні. Деякі частини об'єкту можуть бути закриті, наприклад, іншими об'єктами. ü Зміна точки спостереження: в цілому, процес формування зображення полягає в проектуванні 3D-об'єктів розташованих в 3D просторі на 2D-площину (площина зображення). Таким чином, зовнішній вигляд 2D зображення сильно залежить від відносного положення камери до об'єкта (точки спостереження), що є невідомим для деяких застосувань. Незмінність точки спостереження було б дуже бажаною характеристикою для схеми розпізнавання. На жаль, можна показати, що незмінність точки спостереження неможливо для об'єктів довільної форми. Тим не менш, розробки алгоритмів повинна бути спрямована на забезпечення хоча б часткової незмінності для певного діапазону точки спостереження.
Будь ласка, зверніть увагу, що зазвичай природа застосувань визначає види відхилень з якими схема розпізнавання має впоратися: очевидно, в застосування схем, де використовується підрахунок, існує багато об'єктів на одному зображенні, яке може викликати багато безладу і закриттів об'єкта. Іншим прикладом є розробка алгоритму пошуку зображень в базі даних, для якого недозволено робити припущення про умовах освітленості або точку спостереження камери. На відміну від цього, промислові застосування зазвичай пропонують кілька ступенів свободи, які часто можуть бути використані для усунення або, принаймні, зменшити багатьох відхилень, наприклад, часто може бути забезпечено, що досліджуване зображення містить більше одного об'єкта, які мають бути розпізнані/перевірені, що точка спостереження та освітленість добре розроблені і стабільні, і так далі. З іншого боку, промислові застосування зазвичай вимагають обробки в реальному часі і дуже низький рівень помилок.
Дата добавления: 2014-01-06; Просмотров: 415; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |