Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Центрографический метод




Алгоритмы и параметры кластеризации

Метод иерархических алгоритмов.

Методы кластерного анализа

 

В прикладных социально-экономических исследованиях наи­более широкое применение получили две группы методов кластерного анализа:

1) метод иерархических алгоритмов

2) центрографический метод определения концентрации объектов.

Иерархические алгоритмы — это алгоритмы последовательной кластеризации (группировки) объектов по принципу от общего к частному.

Иерархические алгоритмы подразделяются по количеству,
последовательности и метрике выделяемых кластеров. В последнем случае говорят об алгоритмах ближнего, дальнего и среднего соседа, которые различаются выбором метрик межкластерного расстояния.

Практическая реализация любого иерархического алгоритма предполагает выполнение следующих пяти действий:

1) представление всех последовательно наблюдаемых oбъктов хi (i= 1,2, …, п) в виде п самостоятельных кластеров ki;

2) определение пар наименьших расстояний dlm между объектами l и кластерами т;

3) последовательное объединение выбранных пар и уменьшение числа кластеров на единицу на уровне каждого шага;

4) определение расстояния drq между значением r найденного и любого другого q;

5) последовательное применение действий пп. 2 — 4 до момента получения одного и только одного конечного кластера.

Реализация любого иерархического алгоритма предполагает, что наблюдаемые как внутригрупповые (dij), так и межгрупповые (drq) расстояния нормированы или задаются заранее требуе­мой метрикой.

Общая формула расчета расстояний между кластером r, пред­ставляющим результат объединения кластера l и m, с кластером q следующая:

 

где dlq, dmq, dlm - геометрические расстояния между соответствующими

кластерами;

αl, αт, β, γ— параметры, определяющие конкретный алгоритм иерар­хической кластеризации.

В таблице приведены значения параметров, соответствую­щие трем рассмотренным критериям кластеризации.

Таблица.

 

Алгоритм Значение параметра
αl αт β γ
«Ближний сосед» «Дальний сосед»   «Средний сосед» ½ ½   ½ ½     -½ ½  

 

При использовании центрографического метода (алгоритмов концентрации или сгущения объектов) фиксируются поля по­вышенной плотности скопления наблюдаемых объектов, соот­ветствующие скалярной величине Т, которая представляет радиус сферы наблюдаемых признаков. Поля концентрации при этом идентифицируются путем проведения последовательных расчетов, схема которых включает следующие семь шагов.

Шаг 1. Определим количество точек, попавших в этот ра­диус, на основе произвольно выбранной точки-центра, при заданном радиусе Т.

Шаг 2. Рассчитаем средние значения признаков по совокупности объектов, попавших в первый круг наблюдения.

Шаг 3. Определим среднюю для второго круга наблюдаемых объектов, приняв за очередную точку-центр при том же заданном радиусе Т.

Шаг 4. Представленная процедура поиска указанного рода средних при заданных условиях, будет продолжаться до момента получения устойчивой, т.е. далее не меняющейся средней, равной средней предпоследнего круга наблюдаемых объектов.

Шаг 5. Интерпретируем полученный результат. Объекты, попавшие в последний круг, идентифицируем как объекты первого кластера, и, следовательно, исключаем их из дальнейшего анализа.

Шаг 6. На основе множества объектов, не попавших в первый круг наблюдения, таким же способом образуем новый массив, на базе которого по точно такой же процедуре проводится поиск второго кластера.

Шаг 7. Прекращаем процедуру. Процедура прекращается при условии распределения всех наблюдаемых объектов по кластерам.

Задача.

Проиллюстрируем методы кластерного анализа на примере классификации пяти точек: (4;3), (7;4), (2;0), (2;1), (0;4), изображенных на рисунке

 

Эти точки соответствуют объемам продаж в пяти магазинах небольшой розничной сети, торгующей холодильниками и стиральными машинами. Первая координата соответствует продажам холодильников в магазине за неделю, а вторая координата – продажам стиральных машин.

За метрику расстояний примем квадрат евклидова расстояния.

;

;

;

;

 

;

;

;

 

;

;

 

.

 

Матрица расстояний приведена в таблице:

 

           
           
           
           
           
           

 




Поделиться с друзьями:


Дата добавления: 2014-10-22; Просмотров: 972; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.