КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Факторный анализ
Возникновение и развитие факторного анализа тесно связано с измерениями в психологии. Длительное время факторный анализ и воспринимался как математическая модель в психологической теории интеллекта. Лишь начиная с 50-х годов ХХ столетия, одновременно с разработкой математического обоснования факторного анализа, этот метод становится общенаучным. К настоящему времени факторный анализ является неотъемлемой частью любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим описанием изучаемых объектов, таких, как социология, экономика, биология, медицина и другие. Основная идея факторного анализа была сформулирована еще Ф. Гальтоном, основоположником измерений индивидуальных различий. Она сводится к тому, что если несколько признаков, измеренных на группе индивидов, изменяются согласованно, то можно предположить существование одной общей причины этой совместной изменчивости - фактора как скрытой (латентной), непосредственно не доступной измерению переменной. Таким образом, главная цель факторного анализа - уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно меньшему числу новых переменных - факторов. Фактор при этом интерпретируется как причина совместной изменчивости нескольких исходных переменных. Если исходить из предположения о том, что корреляции могут быть объяснены влиянием скрытых причин - факторов, то основное назначение факторного анализа - анализ корреляций множества признаков. Одна из основных задач факторного анализа – интерпретация факторов. Ее решение заключается в идентификации факторов через исходные переменные. Осуществляется по результатам обработки с помощью факторных нагрузок. Факторные нагрузки – аналоги коэффициентов корреляции, показывают степень взаимосвязи соответствующих переменных и факторов. Чем больше абсолютная величина факторной нагрузки, тем сильнее связь переменной с фактором, тем больше данная переменная обусловлена действием соответствующего фактора. Каждый фактор идентифицируется по тем переменным, с которыми он в наибольшей степени связан, то есть по переменным, имеющим по этому фактору наибольшие нагрузки. Идентификация фактора заключается, как правило, в присвоении ему имени, обобщающего по смыслу наименования входящих в него переменных. Если исследователя интересует только структура измеренных признаков, на этом факторный анализ завершается. Продолжая факторный анализ, исследователь далее может вычислить значения факторов для испытуемых, например, с целью их дифференциации по преобладанию арифметических или вербальных способностей. Выбирая факторный анализ как средство изучения корреляций, исследователь должен отдавать себе отчет в том, что это один из самых сложных и трудоемких методов. Зачастую нет веских оснований предполагать наличие факторов как скрытых причин изучаемых корреляции, и задача заключается лишь в обнаружении группировок тесно связанных переменныx. Тогда целесообразнее вместо факторного анализа использовать кластерный анализ корреляций. Помимо простоты, кластерный анализ обладает еще одним преимуществом: его применение не связано с потерей исходной информации о связях между переменными, что неизбежно при факторном анализе. И уже после выделения групп тесно связанных переменных можно попытаться применить факторный анализ для их объяснения. Итак, можно сформулировать основные задачи факторного анализа: 1. Исследование структуры взаимосвязей переменных. В этом случае каждая группировка переменных будет определяться фактором, по которому эти переменные имеют максимальные нагрузки. 2. Идентификация факторов как скрытых (латентных) переменных - причин взаимосвязи исходных переменных. 3. Вычисление значений факторов для испытуемых как новых, интегральных переменных. При этом число факторов существенно меньше числа исходных переменных. В этом смысле факторный анализ решает задачу сокращения количества признаков с минимальными потерями исходной информации. МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ИДЕИ И ПРОБЛЕМЫ МЕТОДА Модель главных компонент лежит в основе большинства методов факторного анализа и часто рассматривается как один из его самостоятельных вариантов. Анализ главных компонент преобразует набор коррелирующих исходных переменных в другой набор - некоррелирующих переменных. Проще всего понять суть этого метода, привлекая геометрические представления. Предположим, у нас имеются две положительно коррелирующие переменные Х и У, измеренные на группе объектов. Тогда график двумерного распределения (рассеивания) этих объектов в осях измеренных признаков (координаты объектов заданы значениями признаков) будет представлять собой эллипс (рис. 1). Главная ось эллипса М1, - это прямая, вдоль которой будет наблюдаться наибольший разброс данных. Вдоль второй оси эллипса М2, перпендикулярной первой и проходящей через ее середину, будет наблюдаться наименьший разброс данных. Рисунок 1. Рисунок 2. Если перед нами стоит задача представления объектов (точек) в терминах только одной размерности (переменной), то главная ось эллипса является наиболее подходящей, так как вдоль нее объекты отличаются друг от друга лучше (дисперсия больше), чем вдоль любой другой прямой, в том числе и вдоль отдельно оси Х или У. Анализ главных компонент можно представить как преобразование информации, содержащейся в исходных данных. Главную компоненту можно определить как направление, в котором наблюдается наибольший разброс объектов. Представляя объекты в единицах измерения по этой оси, мы теряем минимум информации об отличии объектов друг от друга. Чем сильнее взаимосвязь двух переменных, тем меньше исходной информации теряется при переходе от двух переменных к одной главной компоненте. Если две переменные не коррелируют, то компоненты (оси) являются равнозначными по информативности, и невозможно определить одну из них как «главную» (рис. 2). При наличии трех и более коррелирующих переменных принцип определения главных компонент тот же, только модель будет не на плоскости, а в - мерном пространстве, и будет представлять собой - мерный эллипсоид. Проблемы факторного анализа. 1. Проблема числа факторов. Это первая проблема при проведении факторного анализа. Обычно заранее неизвестно, сколько факторов необходимо и достаточно для представления данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Следовательно, исследователь должен заранее определить или оценить их возможное количество. Для этого на первом этапе факторного анализа применяется анализ главных компонент и используется график собственных значений. Для определения числа факторов используется два критерия – критерий Кайзера и критерий отсеивания Кеттела. Эти критерии являются лишь примерным ориентиром, окончательное решение о числе факторов применяется после интерпретации факторов. 2. Проблема общности. Это вторая главная проблема факторного анализа. Общность – это часть дисперсии переменной, обусловленная действием общих факторов. Характерность – часть дисперсии, обусловленная спецификой данной переменной и ошибками измерений. Иными словами, общность – это вклад всех факторов в единичную дисперсию переменной. Проблема общностей заключается в том, что они как и число факторов, неизвестны до начала анализа, но должны каким-то образом задаваться заранее, так как величины факторных нагрузок зависят от величин общностей. В зависимости от решения этой проблемы различают разные методы факторного анализа, то есть, разные способы получения факторной структуры при заданном числе факторов. Наиболее часто применимые методы – анализ главных компонент, факторный анализ образов, метод главных осей, метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов и метод максимального правдоподобия. 3. Проблема вращения и интерпретации. Это третья основная проблема факторного анализа, решение которой связано с геометрическим представлением факторной структуры. Факторная структура может быть представлена в виде точек-признаков в пространстве факторов. Координаты точки – это факторные нагрузки. Осуществляют поворот осей, чтобы каждая переменная в результате вращения оказалась вблизи оси фактора (варимакс-вращение). В результате вращения каждая переменная имеет нагрузку только по одному фактору. По составу переменных производят интерпретацию факторов. 4. Проблема оценки значений факторов. После интерпретации факторной структуры допустима оценка значений факторов для объектов. Это позволяет перейти к существенно меньшему числу факторов как новых переменных. Это может понадобиться исследователю как для более компактного представления различий между объектами, так и для дальнейшего анализа – регрессионного, дисперсионного и т.д. Для оценки значения фактора используется линейная комбинация значений исходных переменных. Проблема состоит в том, что невозможно точно выразить общий фактор через исходные переменные, можно получить лишь оценку с различной надежностью, так как каждая из переменных содержит кроме общей характерную часть. Факторизация оценки будет тем надежнее, чем больше исходные переменные соответствуют требованиям, предъявляемым к метрическим переменным. В заключение обзора математических идей и проблем метода следует отметить, что факторный анализ – сложная, но изящная математическая процедура, имеющая достаточное статистическое обоснование. Факторный анализ не добавляет новой информации к эмпирическим данным, только позволяет их интерпретировать. ПОСЛЕДОВАТЕЛЬНОСТЬ ФАКТОРНОГО АНАЛИЗА Особенность факторного анализа заключается в неопределенности решения его основных проблем. Нет четких критериев качества, есть лишь рекомендации, которыми руководствуется исследователь. Поэтому факторный анализ – пошаговая процедура, где на каждом шаге принимается решение о дальнейших преобразованиях данных. Весь процесс факторного анализа можно представить как выполнение шести этапов: 1. Выбор исходных данных. Основное требование – все признаки должны быть измерены в метрической шкале. Недопустима функциональная зависимость и корреляции, близкие к единице (для устранения этих переменных вычисляют матрицу интеркорреляций). 2. Решение проблемы числа факторов. Матрица интеркорреляций обрабатывается с использованием анализа главных компонент, применяются критерии отсеивания. 3. Факторизация матрицы интеркорреляций одним из методов. 4. Вращение факторов и их предварительная интерпретация. 5. Принятие решения о качестве факторной структуры. 6. Вычисление факторных коэффициентов и оценок.
До широкого распространения персональных компьютеров полновесный факторный анализ был экзотической, весьма трудоемкой многоэтапной процедурой, когда очередной шаг исследователь выбирает по результатам выполнения предыдущих этапов. В настоящее время можно контролировать процесс факторного анализа, пользуясь современным программным обеспечением. Для этого не нужны знания программиста и математика, достаточны осведомленность в основных математико-статистических идеях метода и умение «читать» промежуточные и конечные результаты факторного анализа. При этом факторный анализ может быть рекомендован для решения очень широкого круга не только исследовательских, но и практических задач. Перечислим некоторые из них: · факторный анализ как инструмент интерпретации позволяет быстро выделить группировки (кластеры) взаимосвязанных переменных, решая проблемы корреляционного анализа: наличия множества переменных и множества статистических проверок. · факторный анализ как альтернатива простого суммирования значений исходных переменных позволяет учитывать реальную структуру данных и избегать излишних потерь драгоценной исходной информации. Затраты времени и сил па такую обработку данных при помощи факторного анализа часто меньше, чем при суммировании баллов «вручную». При этом выигрыш весьма ощутим - в детальности и корректности получаемых результатов. · факторный анализ как подготовительный этап для прогнозирования позволяет получить некоррелированные интегральные переменные (факторы), наиболее пригодные для применения в регрессионном или дискриминантном анализе. · факторный анализ при исследовании индивидуальных или межгрупповых различий по множеству признаков позволяет сократить исходное множество признаков до нескольких факторов, по которым различия проявляются наиболее ярко.
Дата добавления: 2014-01-06; Просмотров: 4728; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |