Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Кластерный анализ

В теме «метод группировок» расчленение совокупности данных на группы производиться по одному признаку. Кластерный анализ – предназначен для группировки (кластеризации) совокупности по многим признакам. Значение каждого из признаков служат координатами каждой единицы изучаемой совокупности в многомерном пространстве признаков. Каждое наблюдение, характеризующееся значениями нескольких показателей, можно представить как точку в пространстве этих показателей, значения которых рассматриваются как координаты в многомерном пространстве. Расстояние между точками p и q с k координатами определяется с помощью:

1) евклидовой метрики; этот метод применяется для переменных в одних единицах измерения

2) нормализованной евклидовой метрики; применяется для переменных в различных единицах измерения

xjp – xjq – абсолютная разность значений j-го признака у единиц совокупности с номерами p и q;

σxj – среднее квадратическое отклонение признака xj.

3) взвешенной евклидовой метрики. При выделении типов социально-экономических явлений группировочные признаки не равноправны: одни признаки имеют большее, другие – меньшее значение. Следовательно, более совершенная методика кластерного анализа должна учитывать разную значимость группировочных признаков:

wj – вес j-го признака

Основным критерием кластеризации является то, что различия между кластерами должны быть более существенны, чем между наблюдениями, отнесенными к одному кластеру, т.е. в многомерном пространстве должно соблюдаться неравенство:

rp,q < r1,2

r1,2 расстояние между кластерами 1 и 2.

Процедура кластеризации достаточно трудоемка и сложна. Но, зная возможности этого метода и используя статистические программные макеты, их может и должен уметь применять каждый аналитик, даже не знающий деталей самой математической теории, на которой он основывается. (Подобно тому, как он может водить автомобиль, не зная устройства его двигателя).

Пример классификации 10 предприятий по структуре их отчетных балансов. Для простоты ограничим классификацию рассмотрением двух показателей.

Показатели структуры активов предприятий, %

№ предприятия                    
Доля ликвидных активов 0,27 0,32 0,20 0,27 0,34 0,20 0,22 0,22 0,21 0,23
Доля запасов 0,40 0,39 0,46 0,39 0,30 0,39 0,42 0,52 0,51 0,42

Используя блок «Статистика» и процедуру «Кластерный анализ» в системе STADIA 5.0, команды и соответственно метод «Дивизивная стратегия динамических сгущений» и «Евклидова метрика», можно сгруппировать предприятия в два кластера.

Рис. Изображение двух кластеров в плоскости показателей структуры балансов

 

На рисунке приведено графическое изображение этих кластеров в координатах рассматриваемых показателей. В результате оказывается, что группировка предприятий в два кластера возможна, первый кластер включает предприятия № 3, 6, 7, 8, 9 и 10, второй - № 1, 2, 4 и 5.

Где применяется кластерный анализ? В маркетинге это сегментация конкурентов и потребителей. В менеджменте: разбиение персонала на различные по уровню мотивации группы, классификация поставщиков, выявление схожих производственных ситуаций, при которых возникает брак. В медицине - классификация симптомов, пациентов, препаратов. В социологии - разбиение респондентов на однородные группы. По сути кластерный анализ хорошо зарекомендовал себя во всех сферах жизнедеятельности человека.
Прелесть данного метода - он работает даже тогда, когда данных мало и не выполняются требования нормальности распределений случайных величин и другие требования классических методов статистического анализа.

Пример, Вы провели анкетирование сотрудников и хотите определить, каким образом можно наиболее эффективно управлять персоналом. То есть Вы хотите разделить сотрудников на группы и для каждой из них выделить наиболее эффективные рычаги управления. При этом различия между группами должны быть очевидными, а внутри группы респонденты должны быть максимально похожи.

Для решения задачи предлагается использовать иерархический кластерный анализ. В результате мы получим дерево, глядя на которое мы должны определиться, на сколько классов (кластеров) мы хотим разбить персонал. Предположим, что мы решили разбить персонал на три группы, тогда для изучения респондентов, попавших в каждый кластер, получим табличку примерно следующего содержания:

Кластер Муж 30-50 лет >50 лет Рук. Мед Льготы з/п стаж Образов.
  80% 90% 5% 70% 10% 12% 95% 30% 30%
  40% 35% 45% 13% 60% 70% 60% 40% 20%
  50% 70% 10% 5% 30% 20% 70% 20% 50%

Поясним, как сформирована приведенная выше таблица:

В первом столбце расположен номер кластера - группы, данные по которой отражены в строке. Например, первый кластер на 80% составляют мужчины. 90% первого кластера попадают в возрастную категорию от 30 до 50 лет, а 12% респондентов считает, что льготы очень важны. И так далее.

Попытаемся составить портреты респондентов каждого кластера.
Первая группа - в основном мужчины зрелого возраста, занимающие руководящие позиции. Соцпакет (MED, LGOTI, TIME-своб время) их не интересует. Они предпочитают получать хорошую зарплату, а не помощь от работодателя.

Группа два наоборот отдает предпочтение соцпакету. Состоит она, в основном, из людей "в возрасте", занимающих невысокие посты. Зарплата для них безусловно важна, но есть и другие приоритеты.

Третья группа наиболее "молодая". В отличие от предыдущих двух, очевиден интерес к возможностям обучения и профессионального роста. У этой категории сотрудников есть хороший шанс в скором времени пополнить первую группу.
Таким образом, планируя кампанию по внедрению эффективных методов управления персоналом, очевидно, что в нашей ситуации можно увеличить соцпакет у второй группы в ущерб, к примеру, зарплате. Если говорить о том, каких специалистов следует направлять на обучение, то можно однозначно рекомендовать обратить внимание на третью группу.

 

6. методы теории принятия решений

<== предыдущая лекция | следующая лекция ==>
Корреляционно- регрессионный анализ | Метод построения дерева решений
Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 763; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.