Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Алгоритм решения задачи компонентного анализа




Модель компонентного анализа

Задача компонентного анализа

 

Компонентный анализ имеет дело с множеством неизвестных факторов и связей. При этом не только число таких факторов и характер их взаимосвязи заранее неизвестны, многие из них латентны и проявляются лишь опосредованно через внешние признаки или их группы. Задача заключается в том, чтобы на основе множества внешних (существенных, мало существенных, и многочисленных ничтожных) признаков найти небольшое, но значимое число их гибридов – компонент.

Значения искомых компонент находятся методом объединения исходных первичных факторов в те или иные группы по тем или иным признакам их связи. Однако компоненты могут находится путем разложения наблюдаемых укрупненных факторов на составляющие.

В первом случае искомые компонентные значения находятся с помощью метода главных компонент. При этом в качестве первой главной компоненты выбирают фактор-признак, вдоль которого массив других наблюдаемых признаков имеет наибольший разброс, а в качестве каждой последующей – очередной по убывающему рангу фактор-признак с максимальным разбросом значений наблюдаемых признаков. Находимые компоненты на всем протяжении расчетного процесса должны быть ортогональны по отношению друг к другу.

Процедура нахождения искомых компонент путем разложения укрупненных факторов на составляющие части аналогична процедуре разложения общей дисперсии на межгрупповые и внутригрупповые.

 

 

Модель компонентного анализа описывается уравнением

 

где Z – матрица () стандартизованных значений исходных объектов и их признаков;

А – матрица () компонентных нагрузок отражающих связь между и;

G – матрица () индивидуальных значений r скрытых признаков, называемых компонентами.1

Исходная матрица компонентного анализа для случая представляется в виде следующей системы уравнений:

 

Исключив нагрузки, близкие к нулю, т.е. нагрузки, отражающие отсутствие связи между и, и оставив только существенные нагрузки, приводим к упрощению матрицы.

Задача компонентного анализа – определить, сколько выделить компонент и каких именно, чтобы по возможности точно воспроизвести и объяснить с их помощью наблюдаемые связи, представляемые в виде корреляционной матрицы.

 

 

Задачи компонентного анализа решаются по шагам:

1. Строим матрицу Х:

 

где - значение j -го показателя у i -го наблюдения.

2. Вычислим среднее значение показателей, а также.

3. Построим матрицу нормированных отклонений Z:

;

, при этом.

4. Формируем матрицу парных коэффициентов корреляции R:

 

При этом, где

5. Преобразуем матрицу А в диагональную матрицу Λ собственных значений многочлена, где Е – единичная матрица.

6. Решим уравнение:

 

корнями которого являются k собственных значений:

.

7. Построим матрицу собственных значений:

 

8. Найдем на основе приведенной матрицы собственные значения, характеризующие вклады соответствующих главных компонент в суммарную дисперсию исходных признаков, равную K, т.е.

При этом первая главная компонента оказывает наибольшее влияние на общую вариацию, а последняя K -я – наименьшая.

9. Определим вклад V-й главной компоненты в суммарную дисперсию как

 

10. Определим суммарный вклад m первых главных компонент, доля которых должна составлять не менее 60-70%:

 

11. Построим матрицу факторных нагрузок:

,

где V - матрица, составленная из нормированных векторов.

12. Определим собственно вектор Uy, соответствующий собственному значению λy корреляционной матрицы R. Значение Uy находим как отличное от нуля путем решения уравнения.

13. Найдем стандартизированное значение собственного вектора

.

14. Исчислим матричный коэффициент a, где j =1,2,…, k - коэффициенты, отражающие тесноту связи между Xj показателем и fν -й главной компонентой, причем, а

.

15. Интерпретируем матрицу факторных нагрузок А как линейных функций исходных признаков. При этом в ходе экономической интерпретации полученных функций fν используем лишь те Xj, для которых

.

16. Построим сводную матрицу всего множества компонент для каждого компонента в отдельности и для всей их совокупности в целом:

,

где F – матрица нормированных значений исходных показателей, на основе которой по алгоритму происходит распознавание главных компонент, дающих в сжатом виде представление о всей структуре наблюдаемых взаимосвязей.

17. Интерпретируя те главные компоненты, собственные значения которых больше единицы, определяем их вклад в суммарную дисперсию, и проводим их оптимизацию.

 

Вопросы и задания

1. Сформулируйте постановку задачи компонентного анализа.

2. Сформулируйте математическую постановку задачи компонентного анализа.

3. Какие шаги необходимо выполнить для решения задачи компонентного анализа.

 


Глава 13. Факторный анализ




Поделиться с друзьями:


Дата добавления: 2014-10-22; Просмотров: 1540; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.