Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Факторный анализ




5.1. ПОСТАНОВКА ЦЕЛИ ИССЛЕДОВАНИЯ И ПРЕДСТАВЛЕНИЕ ИСХОДНЫХ ДАННЫХ В SPSS

Факторный анализ позволяет разделить массив переменных на малое число групп, которые называются факторами. В один фактор объединяются несколько переменных, имеющих плотную корреляцию между собой и слабую корреляцию с переменными, объединяемыми другими факторами.

Основнс задачей факторного анализа является группировка схожих по смыслу утверждений в макрокатегории (факторы) с целью сократить число переменных и упростить процедуру анализа существующей базы данных.

Факторный анализ, как правило, предшествует другим видам анализа, например кластерному. Для примера рассмотрим факторный анализ с целью сокращения массива данных, содержащего информацию об интересах туристов, отдыхающих в курортной зоне «Баварский лес». Фрагмент анкеты, при помощи которой была собрана данная информация, представлен в табл. 5.1.

Например, нужно провести кластерный анализ, позволяющий выделить однородные по возрасту и интересам (мотивам проведения времени на отдыхе) группы туристов. Собранный массив данных, содержащий информацию об интересах туристов, состоит из 12 переменных, каждая из которых может принимать не менее 5 значений (не считая ответов «затрудняюсь ответить» и «не хочу отвечать»). В целях упрощения процедуры кластерного анализа целесообразно провести факторный анализ, который позволит сократить число исследуемых переменных и оптимизировать структуру данных (рис. 5.1).

Таблица 5.1
№ п/п Оцените по 5-балльной шкале, насколько точно подходят для Вас следующие утверждения: Балльная оценка: «1» - полностью подходит «2» - подходит «3» - и да и нет «4» - не подходит «5» - совсем не подходит
  Я хочу расслабиться и просто отдохнуть  
  Я хочу заниматься спортом и закалять организм физическими нагрузками  
  Я ищу как можно больше разнообразных развлечений и удовольствий  
  Мне важен круг общения и возможность знакомства с людьми  
  Я использую отпуск для того, чтобы позаботиться о красоте и здоровье моего тела  
  Я интересуюсь национальными традициями и историей Баварии  
  Во время отдыха мне особенно важно общение с природой (лес, горы, водоемы и т.п.)  
  Я уделяю особое внимание знакомству с достопримечательностями и культурной программе  
  Меня привлекает возможность посетить фестивали, спортивные игры и другие мероприятия  
  Отдых в Восточной Баварии дает мне возможность совершить экскурсии в Австрию, Чехию и другие соседние страны  
  У меня есть возможность выгодно купить предметы народного промысла непосредственно у производителей  
  Мне важно, чтобы я мог пойти куда-нибудь вечером и (или) ночью  
Вопрос № 27 «Что для Вас самое важное во время отдыха?»

 

 

При занесении в файл SPSS данных по ответам респондентов на вопрос анкеты № 27 создается 12 переменных, каждая из которых представляет собой мотив проведения времени на отдыхе. Данные переменные являются интервальными, поскольку их значениями являются балльные оценки их важности для респондентов (рис. 5.2).

Названия двенадцати переменных, содержащих информацию об ответах респондентов на вопрос анкеты № 27, указаны в первом столбце таблицы «Свойства переменных» (Name): от «q__27 _1» до «q_27_12». В столбце «Label» указаны метки переменных, первая из которых — «Спокойный отдых», а последняя — «Ночной/ вечерний досуг».

В столбце «Values» задаются значения меток переменных. При подведении курсора в соответствующую ячейку таблицы и нажатии кнопки мыши на экране появляется диалоговое окно «Значения меток переменных» (Value Labels). В данном диалоговом окне осуществляется кодировка ответов респондентов: «1» — «очень важно», «2» — «важно», «3» — «и да и нет», «4» — «неважно», «5» — «совсем не важно». В столбце «М ssing» указывается кодировка пропущенных ответов: «98» — «затрудняюсь ответить», «99» — «ответа нет».

 

Числовые коды («1», «2»... «5», «98», «99») значении меток переменных, используемые для кодировки ответов респондентов, заносятся е таблицу вкладки «Значения переменных» (Data View) редактора данных SPSS (рис, 5.3).

 

На рис. 5.3 представлен фрагмент таблицы «Свойства переменных», содержащий информацию об ответах респондентов на вопрос анкеты № 27: «Что для Вас наиболее важно во время отдыха?»

Из данных, представленных на рис. 5.3, видно, что для респондента в строке «681» очень важны («1»): спокойный отдых («q_27_l»), возможность знакомства и общения («q_27_4») и путешествия в соседние с Германией страны («q_27_10»). Для этого же респондента не важны («4»): спорт и физические нагрузки («q_27_2»), игры и фестивали («q_27_9»), товары народного промысла («q_27_.ll») и ночной/вечерний досуг («q_27_12») и т.д. В ходе выполнения факторного анализа решаются следующие задачи:

• оценивается пригодность исходных данных для проведения факторного анализа;

• выявляются корреляционные взаимосвязи между переменными исходного массива;

• определяется оптимальное число факторов (компонентов факторной модели), т.е. групп, на которые может быть разделен существующий массив переменных;

• разделяется существующий массив переменных на группы на основании значений коэффициентов корреляции;

• интерпретируются результаты, т.е. производится подбор названий созданным переменным (факторам).

Из перечисленных задач последняя является наиболее сложной. Ее решение представляет собой одну из ключевых проблем факторного анализа и требует творческого подхода.

Другой существенной проблемой факторного анализа является частичная потеря информации в ходе «сжатия» исходного массива переменных. В рассматриваемом примере 12 целей отдыха туристов не являются альтернативными. Например, туристы, заботящиеся о красоте и здоровье своего тела, могут приветствовать физические нагрузки и занятия спортом. Если занятия спортом и заботу о красоте тела объединить в одну группу, признав таким образом, что это одно и то же, произойдет частичная потеря информации. Это будет означать, что туристы, предпочитающие спокойный отдых, не заботятся о красоте и здоровье своего тела, например, когда они загорают на солнце или когда им делают массаж.

Одним из важнейших условий проведения факторного анализа является минимизации частичной потери информации, которая в любом случае неизбежна.

5.2. КОМАНДЫ SPSS НА ВЫПОЛНЕНИЕ ФАКТОРНОГО АНАЛИЗА

Для начала формирования задания на проведение в SPSS процедуры факторного анализа следует выбрать меню «Analyze > Data reduction > Factor...» (рис. 5.4),

 

При выборе меню, представленного на рис. 5.4, открывается диалоговое окно «Факторный анализ» (Factor Analysis) (рис. 5.5).


В правом поле диалогового окна представлен список меток всех переменных, занесенных в базу данных. Из этого списка следует выбрать массив переменных, участвующих в факторном анализе, и перенести его в поле «Var ables». В нашем примере это переменные, содержащие информацию об ответах респондентов на вопрос анкеты № 27: «Что для Вас самое важное во время отдыха?»

В поле «Selection Variable» могут быть указаны переменные для разбивки анализируемых данных на подгруппы. Например, если в поле «Selection Variable» перенести переменную «пол», факторный анализ будет проводиться по двум массивам данных — отдельно для мужчин и женщин. В рассматриваемом примере разделения анализируемых данных на подгруппы не производится.

При выборе команд для проведения анализа в первую очередь необходимо задать команду проверки пригодности существующего массива данных для проведения факторного анализа. Для этого нужно открыть диалоговое окно «Описательные статистические показатели» (Descriptives) (рис. 5.6) путем нажатия одноименной кнопки в диалоговом окне «Факторный анализ» (Factor Analysis) (см. рис, 5.5).

 

В диалоговом окне «Описательные статистические показатели» следует сделать отметку напротив команды «КМО and Bartlett's test of sphericity». Таким образом, делается заявка на проведение тестов «КМО» и «Bartlett», которые проверяют пригодность исходных данных для проведения факторного анализа1. Результаты этих тестов будут представлены далее (см. рис. 5.10).

акже в диалоговом окне «Описательные статистические показатели» в поле «Correlation Matrix» следует сделать отметку напротив команды «Coefficients». Это означает, что в корреляционной матрице будут представлены коэффициенты корреляции между исследуемыми переменными.

Нажав кнопку «Continue» в диалоговом окне «Описательные статистические показатели», мы закрываем данное окно и вновь активизируем главное диалоговое окно «Факторный анализ» (см. рис. 5.5).

Далее необходимо задать условия определения количества факторов, т.е. групп, на которые будет делиться исходный массив переменных. Для этого необходимо открыть диалоговое окно «Извлечение» («Extraction») (рис. 5.7) путем нажатия одноименной кнопки в диалоговом окне «Факторный анализ» (Factor Analysis) (см. рис. 5.5).

 

В диалоговом окне «Извлечение» задается метод извлечения (формирования) факторов. В нашем примере выбирается наиболее распространенный метод «Основных компонентов» (Prinoi ml components). Также задается выведение на экран корреляционной матрицы (Correlation matrix). Результаты выполнения этой команды будут представлены далее (см. рис. 5.11).

Число факторов может быть задано «вручную» путем указания нужною числа в поле «Number of factors» (см. рис. 5.7). Однако для проведения качественного факторного анализа число факторов должно быть определено при помощи расчета «характеристических чисел» (Eigenvalues). В нашем примере задается условие: значение «характеристических чисел» должно быть больше «1» (Eigenvalues over 1). На основании выполнения этого условия будет определяться количество факторов. Результаты выполнения этой команды будут представлены далее (см. рис. 5.12).

Число факторов может быть также определено графическ им способом. Для этого на экран нужно вывести график «характеристических чисел», который запрашивается путем отмегки команды «Screeplot» (см. рис. 5.7). Результаты выполнения этой команды будут представлены далее (см. рис. 5.10).

Путем нажатия кнопки «Continue» в диалоговом окне «Извлечение» (см. рис. 5.7) данное окно закрывается и активизируется вновь главное диалоговое окно «Факторный анализ» (см. рис. 5.5).

 

Следующим шагом выполнения факторного анализа является ротация матрицы коэффициентов. Метод ротации можно выбрать в диалоговом окне «Ротация» (Rotation) (рис. 5.8), которое открывается при нажатии одноименной кнопки в главном диалоговом окне «Факторный анализ» (FactorAnalysis) (см. рис. 5.5):

 

Как показано на рис. 5.8, в нашем примере в качестве метода ротации выбран наиболее распространенный «Van пах». Также задана команда вывода на экран ротированных значений матрицы коэффициентов (Rotated solution). Результаты выполнения этой команды будуг представлены в табл. 5.5. После нажатия кнопки «Continue» в диалоговом окне «Ротация» (см. рис. 5.8) данное окно закрывается и снова активизируется главное диалоговое окно «Факторный анализ» (см. рис. 5.5).

Перед запуском процедуры факторного анализа необходимо запросить создание новых переменных в исходной базе данных. В рассматриваемом примере каждая новая переменная будет представлять собой цель отдыха туристов, объединяющая в себе несколько целей отдыха из их общего числа, заданного изначально. Создание новых переменных запрашивается в диалоговом окне «Значения факторов» (Factor Scores) (рис. 5.9), которое открывается при нажатии одноименной кнопки в диалоговом окне «Факторный анализ» (Factor Analys-s) (см. рис. 5.5).

При отметке команды «Сохранить как переменную» (Save as variable), вновь созданные обобщающие факторы будут сохраняться в базе данных как новые переменные. В качестве метода расчета значений для этих новых переменных в рассматриваемом примере выбирается регрессионная модель (Regression) (рис. 5.9).


 

После нажатия кнопки «Continue» в диалоговом окне «Значения факторов» данное окно закрывается и происходит возврат в главное диалоговое окно «Факторный анализ» (см. рис. 5.5).

Запуск процедуры выполнения факторного анализа осуществляется нажатием кнопки «ОК» в диалоговом окне «Факторный анализ» (Factor Analysis).

5.3. ОЦЕНКА ПРИГОДНОСТИ ИСХОДНЫХ ДАННЫХ ДЛЯ ВЫПОЛНЕНИЯ ФАКТОРНОГО АНАЛИЗА

В первой таблице, выводимой на экран компьютера после запуска процедуры факторного анализа, содержатся результаты тестов «КМО» и «Bartlett» (табл. 5.2).

Результаты теста «КМО» позволяют сделать вывод об общей пригодности имеющихся данных для факторного анализа. Он позволит оценивать, насколько полно построенная факторная модель описывает структуру ответов респондентов на вопросы анкеты, представляющие исследуемые переменные. Результаты данного теста варьируются в интервале от нуля (факторная модель абсолютно неприменима) до единицы (факторная модель идеально описывает структуру данных). Результаты факторного анализа могут считаться действительными, если значение теста «КМО» более 0,5. В рассматриваемом примере значение этого теста 0,668 (табл. 5.2), что свидетельствует о приемлемости построенной факторной модели.

Tест «Bartlett» проверяет гипотезу, согласно которой между переменными, участвующими в факторном анализе, не сушествует корреляционной зависимости. В рассматриваемом примере это означает, чго заданные 12 целей отдыха туристов никак не связаны между собой, и поэтому их группировка с целью уменьшения числа целей отдыха невозможна.

Из данных табл. 5.2 видно, что значимость теста «Bartlett»(Sig.) составляет 0,000. Это означает, что исходная гипотеза может быть отклонена с вероятностью ошибки 0,000, т.е. она неверна, а также свидетельствует о том, что корреляционные связи между переменными исходного массива существуют и возможна их группировка на основании тесноты корреляции.

Исходя из результатов тестов «КМО» и «Bartlett» в рассматриваемом примере можно сделать вывод о пригодности исходных данных нашего примера для проведения факторного анализа.

5.4. ВЫЯВЛЕНИЕ КОРРЕЛЯЦИОННО11 ЗАВИСИМОСТИ МЕЖДУ ПЕРЕМЕННЫМИ ИСХОДНОГО МАССИВА

В качестве результатов факторного анализа на экран компьютера выводится матрица коэффициентов корреляции, характеризующих плотность связи между переменными исходного массива данных (табл. 5.3).

В таблице «Матрица коэффициентов корреляции» представлены результаты попарного сравнения переменных исходного


Таблица 5.3 Матрица коэффициентов корреляции




Поделиться с друзьями:


Дата добавления: 2014-12-29; Просмотров: 1272; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.028 сек.