Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Основи дискримінантного аналізу




Завдання дискримінантного аналізу полягає у виробленні рекомендацій щодо зарахування нових об’єктів до одного з раніше сформованих кластерів.

Розглянемо процедуру зарахування об’єкта дослідження до одного з двох попередньо сформованих кластерів. Допустимо, що з даних статистичних спостережень за n об’єктами, які характеризуються m ознаками, утворено дві вибірки обсягом і ():

 

;

,

де – кількість об’єктів, віднесених до першого кластера, а – кількість об’єктів, віднесених до другого кластера.

Нехай - вектор значень ознак нового об’єкта, який потрібно включити до першого або другого кластера.

Для зарахування нового об’єкта до одного з кластерів визначають межу дискримінації:

, (2.22)

де і - це середні значення дискримінантних функцій, які є лінійною комбінацією класифікаційних ознак.

Значення та відповідно інтерпретують як центри тяжіння першого і другого кластерів і називають центроїдами.

Обчислення центроїдів вимагає попереднього виконання таких кроків:

• знаходження середніх значень ознак для кожного з кластерів:

, (2.23)

де ;

, (2.24)

де ;

• розрахунок елементів коваріаційних матриць ():

,

де

 

; (2.25)

 

,

де

 

; (2.26)

• визначення незміщеної оцінки сумарної коваріаційної матриці:

, (2.27)

• визначення вектора оцінок коефіцієнтів дискримінантної функції:

. (2.28)

За значеннями компонентів вектора А можна обчислити дискримінантні функції та для вхідних даних Х і Y, їхні середні значення, а також дискримінантну функцію для об’єкта, що підлягає включенню до одного з кластерів :

; (2.29)

; (2.30)

 

; (2.31)

; (2.32)

. (2.33)

 

Якщо , тобто оцінка дискримінантної функції для нового об’єкта не менша за межу дискримінації, то його треба зарахувати до сукупності Х, інакше – до сукупності Y.

Процедура дискримінантного аналізу для трьох і більше кластерів суттєво ускладнюється і вимагає використання пакетів прикладних програм статистичного оброблення даних.

Приклад 2.3. На підставі даних сукупностей спостережень, які характеризуються трьома ознаками, у результаті кластерного аналізу отримано дві навчаючі вибірки:

та

відповідно з обсягами р=3 і q=7 (див. попередній приклад). На підставі процедури дискримінантного аналізу визначити, до якої із вибірок (кластерів) зарахувати одиницю спостереження, значення ознак якої подано вектором-рядком .

Результати розрахунку середніх значень ознак і елементів коваріаційних матриць Sx та Sy показано відповідно у табл.2.4 - 2.9.

Таблиця 2.4

Х1 Х2 Х3
     

 

Таблиця 2.5

11,1111 28,4444 75,1111 0,1111 0,4444 0,1111 0,1111 1,7778 2,7778

Таблиця 2.6

-1,1111 3,5556 2,8889 -1,1111 -7,1111 -14,4444 0,1111 -0,8889 -0,5556

 

Таблиця 2.7

Y1 Y2 Y3
     

 

Таблиця 2.8

423,1837 706,0408 158,0408 503,0408 1185,327 238,0408 158,0408 2,040816 0,326531 19,61224 12,7551 2,469388 0,326531 0,183673 2,040816 5,897959 0,326531 2,040816 0,326531 6,612245 2,469388

 


Таблиця 2.9

-29,3878 15,1837 -55,6735 -80,1020 -54,1020 -8,8163 -5,3878 -29,3877 -64,5306 7,1834 32,0408 -19,6735 -39,6735 19,7551 2,0408 -1,3878 -2,5306 -5,1020 0,8980 1,4694 -0,6735

 

Згідно з (2.27) і (2.28) послідовно знаходимо незміщені оцінки сумарної коваріаційної матриці і вектор оцінок коефіцієнтів дискримінантної функції.:

;

;

;

;

.

Користуючись співвідношеннями (2.29), (2.30) і (2.33) отримуємо:

;

 

;

.

Середні значення дискримінантних функцій і відповідно становлять:

;

.

Тоді, з урахуванням (2.22), дискримінантна межа становить .

Оскільки оцінка дискримінантної функції перевищує дискримінантну межу М, то нову одиницю спостереження треба зарахувати до кластера Х.




Поделиться с друзьями:


Дата добавления: 2014-12-16; Просмотров: 676; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.018 сек.