Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Пошаговый дискриминантный анализ




 

Алгоритм выполнения дискриминантного анализа рассмотрен применительно к линейной дискриминантной функции вида. Его основные этапы.

1. Исходные данные представляются либо в табличной форме в виде q подмножеств (обучающих выборок) Mk и подмножества М 0 объектов подлежащих дискриминации, либо сразу в виде матриц X (1), X (2),..., X (q), размером (nk на p):


 

 

Номер подмножества Mk (k = 1, 2,..., q) Номер объекта, i (i = 1, 2,..., nk 2) Свойства (показатель), j (j = 1, 2,..., p)
х 1 х 2 х 0
Подмножество M 1 (k = 1)        
       
n 1      
Подмножество M 2 (k = 2)        
       
n 2      
Подмножество Mq (k = q)        
       
nq      
Подмножество M 0, подлежащее дискриминации        
       
m      

 

где X (k) - матрицы с обучающими признаками (k = 1, 2,..., q),

X (0) матрица новых m -объектов, подлежащих дискриминации (размером m на p),

р — количество свойств, которыми характеризуется каждый i -й объект.

Здесь должно выполняться условие: общее количество объектов N множества М должно быть равно сумме количества объектов m (в подмножестве M 0), подлежащих дискриминации, и общего количества объектов в обучающих подмножествах:, где q - количество обучающих подмножеств (q ≥2). В реальной практике наиболее часто реализуется случай q =2, поэтому и алгоритм дискриминантного анализа приведен для данного варианта.

2. Определяются элементы векторов средних значений по каждому j -му признаку для i объектов внутри k -го подмножества (k = 1, 2):

 

Результаты расчета представляются в виде векторов столбцов:

 

3. Для каждого обучающего подмножества рассчитываются ковариационные матрицы S(k) (размером p × p):

 

4. Рассчитывается объединенная ковариационная матрица по формуле:

 

5. Рассчитывается матрица обратная к объединенной ковариационной матрице:

 

где — определитель матрицы, (причем),

— присоединенная матрица, элементы которой являются алгебраическими дополнениями элементов матрицы.

6. Рассчитывается вектор-столбец дискриминантных множителей с учетом всех элементов обучающих подмножеств по формуле:

Данная расчетная формула получена с помощью метода наименьших квадратов из условия обеспечения наибольшего различия между дискриминантными функциями. Наилучшее разделение двух обучающих подмножеств обеспечивается сочетанием минимальной внутригрупповой вариации и максимальной межгрупповой вариации.

7. По каждому i -му объекту (i = 1, 2,..., N) множества М определяется соответствующее значение дискриминантной функции:

 

8. По совокупности найденных значений F(k) рассчитываются средние значения для каждого подмножества Mk:

 

9. Определяется общее среднее (константа дискриминации) для дискриминантных функций

 

10. Выполняется распределение (дискриминация) объектов подмножества М 0 подлежащих дискриминации по обучающим выборкам М 1 и М 2. С этой целью рассчитанные и п. 7 по каждому i -му объекту значения дискриминантных функций

 

сравниваются с величиной общего среднего. На основе сравнения данный объект относят к одному из обучающих подмножеств.

Если >, то i -й объект подмножества М 0 относят к подмножеству М 1, при > 0 и к подмножеству М 2 при < 0. Если же <, то заданный объект относят к подмножеству М 1, при < 0 и к подмножеству М 2 в противном случае.

11. Далее делается оценка качества распределения новых объектов, для чего оценивается вклад переменных в дискриминантную функцию.

Влияние признаков на значение дискриминантной функции и результаты классификации может оцениваться по дискриминантным множителям (коэффициентам дискриминации), по дискриминантным нагрузкам признаков или по дискриминантной матрице.

Дискриминантные множители зависят от масштабов единиц измерения признаков, поэтому они не всегда удобны для оценки.

Дискриминантные нагрузки более надежны в оценке признаков, они вычисляются как парные линейные коэффициенты корреляции между рассчитанными уровнями дискриминантной функции F и признаками, взятыми для ее построения.

Дискриминантная матрица характеризует меру соответствия результатов классификации фактическому распределению объектов по подмножествам и используется для оценки качества анализа. В этом случае дискриминантная функция F формируется по данным объектов (с измеренными p признаками) обучающих подмножеств, а затем проверяется качество этой функции путем сопоставления фактической классовой принадлежности объектов с той, что получена в результате формальной дискриминации.

Задача.

Имеются данные по двум группам промышленных предприятий отрасли:

Х 1 - среднегодовая стоимость основных производственных фондов, млн. д.ед.;

Х 2 — среднесписочная численность персонала, тыс. чел.;

Х 3 — балансовая прибыль млн. д.ед.

Исходные данные представляются в табличной форме

 

Номер группы Mk (k = 1, 2) Номер предприятия, i (i = 1, 2,..., nk) Свойства (показатель), j (j = 1, 2,..., p)
Х 1 Х 2 Х 3
Группа 1, M 1 (k = 1)   224,228 17,115 22,981
  151,827 14,904 21,481
  147,313 13,627 28,669
  152,253 10,545 10,199
Группа 2, M 2 (k = 2)   46,757 4,428 11,124
  29,033 5,51 6,091
  52,134 4,214 11,842
  37,05 5,527 11,873
  63,979 4,211 12,860
Группа предприятий M 0, подлежащих дискриминации   55,451 9,592 12,840
  78,575 11,727 15,535
  98,353 17,572 20,458

 

Необходимо провести классификацию (дискриминацию) трех новых предприятий, образующих группу М 0 с известными значениями исходных переменных.

Решение:

1. Значения исходных переменных для обучающих подмножеств M 1 и M 2 (групп предприятий) записываются в виде матриц X (1) и X (2)

 

и для подмножества M 0 группы предприятий, подлежащих классификации в виде матрицы X (0)

 

Общее количество предприятий, составляющих множество М, будет равно N = 3+4+5 = 12 ед.

2. Определяются элементы векторов средних значений по j признакам для i -х объектов по каждой k -й выборке (k = 1, 2), которые представляются в виде двух векторов (по количеству обучающих выборок):

 

3. Для каждого обучающего подмножества M 1 и M 2 рассчитываются ковариационные матрицы Sk (размером р × р):

 

4. Рассчитывается объединенная ковариационная матрица:

 

5. Рассчитывается матрица обратная к объединенной ковариационной матрице:

 

6. Рассчитываются дискриминантные множители (коэффициенты дискриминантной функции) по всем элементам обучающих подмножеств:

 

7. Для каждого i -го объекта k -го подмножества М определяется значение дискриминантной функции:

 

8. По совокупности найденных значений F(k) рассчитываются средние значения для каждого подмножества Mk:

 

 

9. Определяется общее среднее (константа дискриминации) для дискриминантных функций:

 

10. Выполняется распределение объектов подмножества М 0 по обучающим подмножествам М 1 и М 2, для чего по каждому объекту (i = 1, 2, 3) рассчитываются Дискриминантные функции

 

и затем рассчитанные значения дискриминантных функций F (0) сравниваются с общей средней = 28,3556.

Поскольку >, то i -й объект подмножества М 0 относят к подмножеству М 1 при > 0 и к подмножеству М 2 при < 0. С учетом этого в данном примере предприятия 2 и 3 подмножества М 0 относятся к М 1, а предприятие 1 — к М 2.

Если бы выполнялось условие <, то объекты М 0 относились к подмножеству М 1, при < 0 и к подмножеству М 2 в противном случае.

11. Оценку качества распределения новых объектов выполним путем сравнения с константой дискриминации значений дискриминантных функций обучающих подмножеств М 1 и М 2. Поскольку для всех найденных значений выполняются неравенства, и, то можно предположить о правильном распределении объектов и уже существующих двух классах и верно выполненной классификации объектов подмножества М 0.

 

Вопросы и задания

1. Сформулируйте постановку задачи дискриминантного анализа.

2. Какие факторные и результативные переменные могут принимать участие в дискриминантном анализе?

3. Сформулируйте математическую постановку задачи дискриминантного анализа.

4. Какой критерий используется для отбора дискриминирующих переменных?

5. Для каких целей может использоваться дискриминантный анализ в задачах государственного управления и менеджменте?

 





Поделиться с друзьями:


Дата добавления: 2014-10-22; Просмотров: 1005; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.025 сек.