Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Характеристики близькості об'єктів

Об'єднання або метод деревовидної кластеризації використовується при формуванні кластерів несхожості або відстані між об'єктами. Ці відстані можуть визначатися в одновимірному або багатовимірному просторі. Наприклад, якщо ви повинні кластеризувати типи їжі в кафе, то можете взяти до уваги кількість містяться в ній калорій, ціну, суб'єктивну оцінку смаку і т.д. Найбільш прямий шлях обчислення відстаней між об'єктами в багатовимірному просторі полягає в обчисленні евклідових відстаней. Якщо ви маєте двох-або тривимірний простір, то цей захід є реальним геометричним відстанню між об'єктами в просторі (як ніби відстані між об'єктами виміряні рулеткою). Однак алгоритм об'єднання не "дбає" про те, чи є "надані" для цього відстані справжніми або деякими іншими похідними заходами відстані, що більш значимо для дослідника; та завданням дослідників є підібрати правильний метод для специфічних застосувань.

Розглянемо основні способи визначення близькості між об'єктами (Таблиця 1.1)

Т аблиця 1.1

показники   Формули
Для кількісних шкал
лінійна відстань
евклідова відстань
Квадрат евклідів відстані
Узагальнене ступовий відстань Мінковського
відстань Чебишева
Відстань міських кварталів (Манхеттенський відстань)

 

Евклідова відстань є найпопулярнішою метрикою в кластерному аналізі. Воно попросту є геометричним відстанню в багатовимірному просторі. Геометрично воно найкраще об'єднує об'єкти в кулястих скупченнях.

Квадрат евклідового відстані. Для додання більших ваг більш віддаленим один від одного об'єктам можемо скористатися квадратом евклідового відстані шляхом зведення в квадрат стандартного евклідового відстані.

Узагальнене ступовий відстань представляє тільки математичний інтерес як універсальна метрика.

Відстань Чебишева. Це відстань варто використовувати, коли необхідно визначити два об'єкти як "різні", якщо вони відрізняються по якомусь одному вимірюванню.

Манхеттенський відстань (відстань міських кварталів), також зване "Хеммінговим" або "сіті-блок" відстанню. Це відстань розраховується як середнє різниць по координатах. У більшості випадків ця міра відстані приводить до результатів, подібним розрахунками відстані Евкліда. Однак, для цього заходу вплив окремих викидів менше, ніж при використанні евклідового відстані, оскільки тут координати не зводяться в квадрат.

Відсоток незгоди. Це відстань обчислюється, якщо дані є категоріальними.

 

<== предыдущая лекция | следующая лекция ==>
Вимірювання близькості об'єктів | Ієрархічні алгоритми
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 1717; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.