Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Функционалы качества разбиения

Существует большое количество различных способов разбиения на классы заданной совокупности элементов. Поэтому представляет интерес задача сравнительного анализа качества этих способов разбиения. С этой целью вводится понятие функционала качества разбиения Q (S), определенного на множество всех возможных разбиений.

Наилучшее разбиение S* представляет собой такое разбиение, при котором достигается экстремум выбранного функционала качества. Следует отметить, что выбор такого или иного функционала качества разбиения, как правило, опирается на эмпирическое соображения.

Рассмотрим некоторое наиболее распространенные функционалы качества разбиения. Пусть исследованием выбрана метрика в пространстве X и S=(S1,S2,…,Sp) некоторое фиксированное разбиение наблюдений X1, X2,…,Xn на заданное число классов S1,S2,…,SP.

Существуют следующие характеристики функционала качества:

─ сумма внутриклассовых дисперсий

; (7.12)

─ сумма попарных внутриклассовых расстояний между элементами

(7.13)

или

, широко используются в задачах кластерного анализа для сравнения качества процедур разбиения;

─ обобщенная внутриклассовая дисперсия

(7.14)

где det A - определитель матрицы А;

Wl = выборочная ковариационная матрица класса Sl, элементы которой определяются по формуле

где q,m=1,2,…,k,

где -q-я компонента многомерного наблюдения xi;

- среднее значение q-й компоненты, вычисленное по наблюдениям l-го класса.

Качество разбиения характеризуют и другим видом обобщенной дисперсии, в которой операция суммирования Wi заменена операцией умножения

.

Отметим, что функционалы , обычно используют при решении вопроса: не сосредоточены ли наблюдения, разбитые на классы, в пространстве размерности, меньшей, чем k.

 

 

<== предыдущая лекция | следующая лекция ==>
Расстояние между кластерами | Иерархические кластер-процедуры
Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 1034; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.