Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Обнаружение интересующего исследователя эффекта в одной или разных выборках испытуемых




7.12.1. Биномиальный критерий m. Это самый простой из всех статистических критериев, который позволяет оценить, насколько эмпирическая частота какого-либо признака в одной выборке (от 5 до 300 наблюдений) отличается от заданной теоретической, среднестатистической и т.д. Эмпирическая частота и является эмпирическим значением биномиального критерия m, которое сравнивается с табличным для соответствующего числа наблюдений при заданной вероятности проявления интресующего исследователя эффекта.

Например, если в некотором эксперименте испытуемые решают анаграммы слов с двумя равновероятными исходами (типа ''борза'' – анаграмма слов ''образ'' и ''забор''), но, при этом, один вариант решения встречается гораздо чаще и его частота статистически отличается от теоретической, то можно предположить, что здесь проявляется эффект связанный с влиянием некоторого фактора (например, дефицита времени или опыта решения предыдущих задач).

7.12.2. -критерий Фишера с угловым преобразованием. Данный критерий является многофункциональным критерием, т.е. он применим по отношению к самым разнообразным задачам и самым различным типам данных. Он вычисляется по формуле:

,

где угол, соответствующей большей процентной доле, выраженный в радианах

угол, соответствующей меньшей процентной доле, выраженный в радианах

n1 количество наблюдений в выборке 1

n2 количество наблюдений в выборке 2

 

Он имеет следующие особенности:

1. Позволяет сравнивать две выборки или одну и ту же выборку в разных условиях по степени выраженности интересующего исследователя эффекта;

2. Позволяет определить сдвиг значений признака под влиянием фактора;

3. Позволяет сопоставить выборки как по качественному, так и по количественно определяемому признаку.

4. Минимальный объем одной из выборок может быть равен 2, но максимальный – не ограничен, хотя в тех случаях когда выборки очень малы, достоверные различия обнаружить скорее всего не удастся.

 

  Есть эффект Нет эффекта
Группы Количество испытуемых Процентная д доля Количество испытуемых Процентная д доля
 
1 группа   54.2 %   45.8 %
2 группа   75.0 %   25.0 %

 

, n1 = 12

, n2 = 24

=1.242, = 1.64

Вывод: группы испытуемых не различаются достоверно по проявлению эффекта, т.к. <

 

Перечисленные выше статистические критерии предназначены только для сопоставления двух распределений, вне зависимости от решаемой исследователем задачи. Помимо этих критериев существует еще и те, которые позволяют сопоставлять три, четыре и большее количество распределений, а также решать более сложные задачи. Многие ответы на вопросы могут быть получены и при комбинированном применении статистических критериев, а также в совокупности с другими методами математической статистики, что, как правило, рассматривается в специальных руководствах.

7.13. Единицы измерения статистических мер. При описании результатов своих исследований любому специалисту важно понимать не только в какой шкале и в каких единицах измерялся признак, но и в каких единицах измеряются статистические меры, чтобы перевести полученные результаты с языка математической статистики на язык своей науки. Ниже приводится таблица единиц измерения описанных в пособии статистических мер.

 

 

Статистические меры Единицы измерения
Среднее арифметическое Единицы признака
Медиана Единицы признака
Мода Единицы признака
Квантили распределения Единицы признака
Размах Единицы признака
Среднее отклонение Единицы признака
Дисперсия Квадрат единицы признака
Стандартное отклонение Единицы признака
Стандартная оценка Условные единицы
Асимметрия Условные единицы
Эксцесс Условные единицы
Коэффициенты корреляции Все в условных единицах
Коэффициент регрессии Условные единицы
Статистические критерии Все в условных единицах

Таблица 7.2. Единицы измерения статистических мер.


8. ДИСПЕРСИОННЫЙ АНАЛИЗ

8.1. Общие сведения. Дисперсионный анализ был разработан английским биологом и математиком Рональдом Фишером (1890-1962). Дисперсионный анализ (далее - ДА) – это статистический метод изучения влияния отдельных контролируемых факторов на изменчивость изучаемого признака. Необходимость в применении ДА возникает тогда, когда производится серия измерений какой-либо одной переменной в разных условиях, причем число условий должно быть больше двух (в противном случае данную задачу можно решить иными методами). Например, это могут быть несколько экспериментальных групп, различающихся по каким-либо признакам (возрасту, уровню образования, социальному положению и т.д.) участвующих в качестве испытуемых в одних и тех же условиях эксперимента. Это может быть одна и та же экспериментальная группа принимающая участие в эксперименте в разных экспериментальных условиях, например, простых, усложненных и очень сложных. Наконец, это могут быть несколько эксперименальных групп, принимающих участие в эксперименте с разными экспериментальными условиями, но при этом экспериментатор должен придерживаться гипотезы, что интериндивидуальные различия не оказывают влияния на вариативность результатов, которые, в свою очередь, могут зависеть только от условий эксперимента.

8.2. Виды переменных в ДА. Все переменные в ДА принято делить на два вида – независимые и зависимые переменные. Независимой переменной (фактором) называется контролируемая экспериментатором переменная. Независимыми переменными могут быть пол испытуемых, возраст, национальность, принадлежность к какой-либо социальной группе и т.д., поскольку именно по каким-либо различиям между испытуемыми будут сформированы экспериментальные группы. В качестве независимых переменных могут выступать и психологические переменные, такие как уровень развития интеллекта, свойства темперамента или характера, особенности эмоциональной сферы и т.д. Независимой переменной могут быть действия других людей, которым подвергаются испытуемые или условия проведения эксперимента. Независимую переменную принято делить на уровни. Уровни независимой переменной могут различаться как количественно, так и качественно. Уровнями независимой переменной может быть, например, уровень мотивации испытуемых (высокий, средний, низкий), уровень шума и его влияние на результативность деятельности и т.д, которые различаются лишь количественно. Уровни независимой переменной могут представлять собой не только градации какого-либо фактора. Уровнями независимой переменной могут быть, например, цвет стимулов, виды заболеваний, виды рекламы и т.д., которые различаются прежде всего качественно. В таком случае их правильнее будет называть условиями действия фактора или условиями эксперимента.

Зависимой переменной называется переменная, которая при ее измерении во время эксперимента подвергается влиянию независимой. Например, возраст испытуемых может влиять на уровень цветовой чувствительности (зависимая переменная), уровень интеллекта на скорость решения творческих задач, социальное положение на ценностные ориентации и т.д.

8.3. Виды ДА. Дисперсионный анализ принято делить на несколько видов согласно количеству независимых переменных: однофакторный ДА (одна независимая переменная), двухфакторный ДА (две независимых переменных), трехфакторный ДА (три независимых переменных) и мультифакторный ДА (больше трех независимых переменных). Обычно исследования ограничиваются применением только двух первых видов ДА, поскольку уже в трехфакторном ДА вычисления являются довольно громоздкими и часто требуют большого эмпирического материала. Но во всех видах ДА зависимая переменная остается только одна.

8.4. Структура данных в однофакторном и двухфакторном ДА. Обычная структура данных в однофакторном ДА может быть представлена в виде таблицы с J -количеством столбцов (см. рис.8.1) и n -количеством наблюдений в каждом столбце (причем их количество может быть разным), где столбцами являются условия эксперимента или уровни независимой переменной (в данном случае их четыре), а зависимая переменная представляет собой результаты измерения признака, где каждое отдельное значение обозначается как xi,j.

Независимая переменная (фактор)
1 уровень 2 уровень 3 уровень 4 уровень
X1,1 X1,2 X1,3 X1,4
X,2,1 X,2,2 X,2,3 X,2,4
X3,1 X3,2 X3,3 X3,4
X4,1 X4,2 X4,3 X4,4
X5,1 X5,2 X5,3 X5,4
. . . .
. . . .
. . . .
. . . .
Xn,1 Xn,2 Xn,3 Xn,4

Рис.8.1. Структура данных в однофакторном дисперсионном анализе

Структура данных в двухфакторном ДА отличается тем, что добавляется вторая независимая переменная со своими уровнями, которых также должно быть не менее двух. На рис.8.2. представлена таблица данных для двухфакторного дисперсионного анализа с I -количеством уровней фактора А (в данном случае их три), J -количеством уровней фактора Б (в данном случае их два) и k -наблюдениями в каждой ячейке, образованном сочетанием уровней переменных А и Б, причем количество наблюдений в каждой ячейке может быть различным.

      ФАКТОР ''Б’’  
      1 УРОВЕНЬ 2 УРОВЕНЬ  
      X1,1,1 . X1,2,1 .  
      X1,1,2 . X1,2,2 .  
  1 УРОВЕНЬ X1,1,3 . X1,2,3 .
Ф     X1,1,4 . X1,2,4 .  
А     X1,1,5 X1,1,k X1,2,5 X1,2,k  
К     X2,1,1 . X2,2,1 .  
Т     X2,1,2 . X2,2,2 .  
О 2 УРОВЕНЬ X2,1,3 . X2,2,3 .
Р     X2,1,4 . X2,2,4 .  
      X2,1,5 X2,1,k X2,2,5 X2,2,k  
''А''     X3,1,1 . X3,2,1 .  
      X3,1,2 . X3,2,2 .  
  3 УРОВЕНЬ X3,1,3 . X3,2,3 .
      X3,1,4 . X3,2,4 .  
      X3,1,5 X3,1,k X3,2,5 X3,2,k  

Рис.8.2. Структура данных в двухфакторном дисперсионном анализе

 

8.5. Задачи ДА. Главной задачей в однофакторном ДА является определение отношения вариативности (дисперсии), обусловленной действием независимой переменной (фактора) к случайной вариативности, обусловленной влиянием всех неизвестных факторов (т.н. F-отношение или F-критерий). Если это отношение превышает критическое значение, то тогда признается достоверным влияние независимой переменной на зависимую.

В двухфакторном ДА экспериментатор решает уже три задачи:

1. Определение отношение вариативности обусловленной действием переменной А к случайной вариативности (Fэмп А);

2. Определение отношение вариативности обусловленной действием переменной Б к случайной вариативности (Fэмп Б);

3. Определение отношение вариативности обусловленной действием переменных А и Б к случайной вариативности (Fэмп АБ).

При этом может оказаться что:

1. На вариативность результатов влияет только одна независимая переменная (т.е. либо Fэмп А, либо Fэмп Б превышает критическое значение, но Fэмп АБ не превышает);

2. На вариативность результатов влияют обе независимые переменные, но взаимодействие переменных влияния не оказывает (т.е. они как бы ''нейтрализуют'' друг друга и следовательно: Fэмп А и Fэмп Б превышают критические значения, но Fэмп АБ не превышает);

3. На вариативность результатов независимые переменные по отдельности не влияют, но их взаимодействие оказывает влияние (т.е. они как бы ''катализируют'' друг друга и следовательно: Fэмп А и Fэмп Б не превышают, а Fэмп АБ превышает критическое значение);

4. На вариативность результатов влияет одна из переменных, и кроме того, обнаруживается влияние взаимодействия обеих переменных (либо Fэмп А, либо Fэмп Б превышает критическое значение, и Fэмп АБ также превышает);

5. На вариативность результатов влияют как обе переменные, так и их взаимодействие (все три F-критерия превышают критическое значение);

6. На вариативность результатов не влияет ни одна из переменных, и их взаимодействие также не оказывает никакого влияния (ни один из трех F-критериев не превышает критического значения).

8.6. Ограничения применения ДА. ДА можно применять только в том случае, когда переменная измерена в шкале интервалов или отношений, т.е. когда можно вычислить основные параметры распределения (средние и дисперсии). Кроме того, должно быть либо известно, либо доказано, что зависимая переменная подвержена нормальному распределению (в противном случае полученные выводы могут оказаться ложными). В двухфакторном ДА помимо перечисленнных требований обязательным условием является то, что факторы должны быть независимы друг от друга и количество их градаций также должно быть не меньше двух.

8.7. Модель для данных в ДА. Обычная линейная модель для данных в однофакторном ДА выглядит следующим образом:

 

, где

 

x – конкретное значение переменной,

– (греч. “мю”) генеральное среднее

A – доля отклонения переменной, обусловленная влиянием фактора А

e – ошибка наблюдения (случайное отклонение).

 

Для двухфакторного ДА эта модель будет:

 

, где

 

x – конкретное значение переменной,

– (греч. “мю”) генеральное среднее

A – доля отклонения переменной, обусловленная влиянием фактора А

B – доля отклонения переменной, обусловленная влиянием фактора B

AB – доля отклонения переменной, обусловленная взаимодействием факторов А и B

e – ошибка наблюдения (случайное отклонение)

 

8.8. Гипотезы в ДА. Нулевая гипотеза в однофакторном ДА будет утверждать, что средние значения исследуемого признака на всех уровнях независимой переменной одинаковы. Иначе говоря, независимая переменная не оказывает никакого влияния на зависимую и, следовательно, средние значения признака от уровня к уровню независимой переменной не меняются. Альтернативная гипотеза будет утверждать, что средние значения признака от уровня к уровню независимой переменной меняются (увеличиваются или уменьшаются), т.е. независимая переменная влияет на зависимую. Что касается двухфакторного дисперсионного анализа, то таких гипотез будет уже три: относительно влияния фактора А, фактора Б и взаимодействия факторов А и Б на зависимую переменную.

8.9. Порядок расчетов в однофакторном ДА. В однофакторном ДА необходимо найти F-критерий, который определяется по формуле:

, где

MSфакт – дисперсия, обусловленная влиянием фактора (“сумма квадратов между группами” (см. ниже) деленная на число степеней свободы между группами)

MSслуч – случайная дисперсия (“сумма квадратов внутри групп” деленная на число степеней свободы внутри групп)

и

, где

SSфакт – сумма квадратов отклонений случайной величины от общей средней (“сумма квадратов между группами”)

SSслуч – остаточная сумма квадратов (“сумма квадратов внутри групп”)

dfфакт­ – число степеней свободы между группами

dfслуч – число степеней свободы внутри групп

 

 

и

Из изложенного выше видно, что сумма квадратов между группами и сумма квадратов внутри групп составляют общую или полную сумму квадратов, которая определяется по формуле:

, т.е.

.

Однофакторный ДА, таким образом, представляет собой разложение общей суммы квадратов на две составляющие: обусловленную влиянием фактора и обусловленную случайными влияниями.

 

Пример вычисления F-критерия в однофакторном ДА:

 

Независимая переменная (фактор)
1 уровень 2 уровень 3 уровень 4 уровень  
         
         
         
         
         
         
         
         
         
         

 

 

 

 

 

Вывод: Fэмп > Fкрит: влияние фактора достоверно

 

 

8.10. Порядок расчетов в двухфакторном ДА. В двухфакторном ДА необходимо подсчитать три F-критерия:

,,, где

MSA – дисперсия, обусловленная влиянием фактора A,

MSB – дисперсия, обусловленная влиянием фактора B,

MSAB – дисперсия, обусловленная влиянием взаимодействия факторов AB,

MSслуч – случайная дисперсия,

которые расчитываются следующим образом:

,, и, где:

SSA – сумма квадратов отклонений обусловленная фактором A,

SSB – сумма квадратов отклонений обусловленная фактором B,

SSAB – сумма квадратов отклонений обусловленная взаимодействием факторов A и B,

SSслуч – остаточная сумма квадратов.

 

Суммы квадратов вычисляются по следующим формулам:

 

 

 

 

 

Степени свободы подсчитываются по формулам:

 

,,,

 

Пример вычисления F-критериев в двухфакторном ДА:

 

      ФАКТОР ''Б’’
      1 УРОВЕНЬ 2 УРОВЕНЬ  
               
               
  1 УРОВЕНЬ          
Ф              
А              
К              
Т              
О 2 УРОВЕНЬ          
Р              
               
''А''              
               
  3 УРОВЕНЬ          
               
               

 

Суммы по строкам

 

 

 

 

Суммы по столбцам

 

 

 

 

 

 

Критические значения:

 

 

 

Вывод: Поскольку из всех F-критериев только FB превышает критическое значение, то, следовательно, на вариативность результатов достоверно влияние только фактора ''Б''.


9. РЕГРЕССИОННЫЙ АНАЛИЗ

 

9.1. Общие сведения. Регрессионный анализ (далее - РА) - это статистический метод изучения изменения значений одной переменной от изменения значений другой переменной на единицу измерения. В широком смысле РА изучает связь между переменными, зависимость одной переменной от другой и влияние одной переменной на другую. Однако, в отличии от коэффициента корреляции и дисперсионного анализа РА дает ответ на один очень важный вопрос: как изменится значение одной переменной, если значение другой переменной изменилось на некоторое количество единиц ее измерения. Такого рода задача может возникнуть в том случае, если необходимо знать какой тестовый балл окажется у испытуемого по тесту А, если нам известен его тестовый балл по тесту Б и насколько возрастет (уменьшится) тестовый балл данного испытуемого по одному тесту, если изменится тестовый балл по другому. В качестве еще одного примера применения РА можно привести следующие задачи:

1. Как изменится мотивация персонала фирмы, если зарплата будет увеличена на определенное количество денежных единиц.

2. Насколько изменится спрос на товар, если общее время показа рекламы по телевидению увеличится на определенное количество минут.

3. Насколько точно можно оценить успеваемость по интеллекту.

4. Как изменится самооценка подростка, если его социометрический статус возрастет.

5. Как зависит оценка студента на экзамене от успеваемости в течение семестра.

Правда, нужно отметить, что для решения такого рода задач необходима предварительная статистика, т.е. исследователь должен располагать данными измерений двух случайных величин, зависимость одной из которых от другой он исследует.

9.2. Задачи и вычислительные процедуры РА. Основные задачи РА - решение уравнений регрессии и построение линии регрессии. Основное уравнение линейной регрессии выглядит следующим образом:

, где:

Y - изучаемый признак, переменная, которая испытывает на себе влияние другой переменной;

X - переменная, оказывающая влияние на переменную Y;

a - коэффициент регрессии, определяющий наклон линии регрессии по отношению к осям X иY;

b - константа, определяющая высоту линии регрессии над осью X.

По сути - это уравнение прямой в декартовой системе координат и решение уравнения регрессии сводится к нахождению коэффицента регрессии и свободного члена в уравнении регрессии, которые определяются по формулам:

;

.

Аналогичным образом можно построить уравнение зависимости не только Y от X, но и X от Y, что требует замены переменных местами. Однако, статистика не может заменить собой логики, и поэтому математически такая перестановка осуществима, но логически может быть совершенно не оправдана. Можно, например, изучать зависимость успеваемости от интеллекта у школьников первого класса, но вряд ли целесообразно будет изучение зависимости интеллекта от успеваемости у тех же школьников, если интеллект у них формировался задолго до того, как появилась успеваемость. Вопрос о причинно-следственных связях в таких случаях всегда остается на совести исследователя.

Следующей задачей РА является построение линии регрессии, которая отражает изменение значения одной переменной от изменения значения другой. Здесь необходимо сказать, что линия регрессии показывает не действительные, а только наиболее вероятные значения Y, что нисколько не умаляет достоинств РА. Во-первых, дело в том, что эмпирические данные при одном значении X могут содержать некоторый разброс значений Y, что естественно для случайных величин. РА покажет, в таком случае, как раз те значения, которые следует ожидать при увеличении количества наблюдений. Во-вторых, по уравнению регрессии можно определить наиболее вероятные значения Y по гипотетическим значениям X, т.е. тем, которые не встречаются в эмпирических данных, поэтому довольно часто в статистике линию регрессии называют еще линией предсказания.

9.3. Эмпирическая задача. Необходимо установить зависимость между успеваемостью студентов факультета психологии ДГУ по математическим методам в психологии в течении семестра, определенной по 18-бальной рейтинговой системе (min=0; max=18) и итоговой оценкой на экзамене (по привычной 5-бальной системе). Исходные данные и расчеты представлены в таблице 1. Достаточно беглого вгляда, чтобы заметить, что между двумя случайными величинами существует достоверная связь. Однако коэффициента корреляции (rx,y = 0.825) недостаточно, чтобы определить какую оценку студента на экзамене можно прогнозировать при 6-ти или 13-ти баллах, т.е. при тех значениях X, которые отсутствуют в эмпирических данных.

Таблица 9.1. Данные для регрессионного анализа

Испытуемые Семестр (X) Экзамен (Y) XY X*X
  И.М.        
  А.С.        
  С.О.        
  М.В.        
  Ф.О.        
  М.Б.        
  О.С.        
  П.Г.        
  Ч.А.        
  Б.Б.        
  Б.А.        
  Н.О.        
  Х.С.        
  Г.Е.        
  Г.Ж.        
  Р.Г.        
  Д.О.        
  З.В.        
  В.Л.        
  Ф.А.        
  К.Е.        
  Л.А.        
  М.Л.        
  П.О.        
  Е.Д.        
  К.Д.        
  Л.Е.        
  Б.Е.        
  М.М.        
  О.М.        
  Р.С.        
  Д.Е.        
  З.И.        
  Х.И.        
  Ч.Е.        
  Суммы        
  Средние 11,57 3,97    

 

 

Уравнение регрессии:

Сейчас по полученному уравнению можно рассчитать наиболее вероятные значения оценки на экзамене, зная оценку в течении семестра. Так при 6-ти баллах в семестре оценка студента на экзамене будет равна 2.92 (т.е. не выше тройки), при 13-ти баллах – 4.24 (достаточно твердая четверка), а для получения отличной оценки вполне достаточно 17-ти баллов, т.к..

9.4. Построение линии регрессии. На рис 9.1. видна построенная по эмпирическим данным (точки) и результатам вычислений линия регрессии. Линия регрессии проходит через точки, которые соответствуют наиболее вероятным значениям одной переменной при соответствующих значениях другой и, при этом, она всегда проходит через точку с координатами, соответствующим средним арифметическим двух переменных.

 


Рис. 9.1. Диаграмма рассеивания X (полученные в семестре баллы) и Y (оценка на экзамене) с построенной эмпирической линией регрессии.

 

Построенная таким образом линия в общем виде определяет зависимость одной переменной от другой и при интерпретации результатов регрессионного анализа необходимо учитывать, что в них не отражены отдельные случаи, как например, очень низкое значение одной переменной при высоком значении другой, хотя если и появится такой случай, то он обязательно повлияет как на уравнение, так и на линию регрессии.

9.5. Достоверность линии регрессии и уравнения регрессии. После того, как вычислен коэффициент регрессии, его достоверность может быть определена по формуле:

, где

 

 

 

В нашем примере tэмп = 8.39. Полученное значение сравнивается с критическими значениями t-критерия Стьюдента с n-2 числом степеней свободы. Если tэмп превышает t0.01, то коэффициент регрессии и линия регрессии могут быть признаны достоверными. Что касается данного примера, то t0.01 = 2.75, и, следовательно, коэффициент регрессии и линия регрессии достоверны.

9.6. Ограничения в применении РА. РА применим только по отношению к переменным, которые выражены в шкале интервалов или отношений. И, хотя в приведенном выше примере использовалась шкала оценки на экзамене, которая не является шкалой равных интервалов, тем не менее в ней можно подсчитать средние и дисперсию, что является обязательным требованием к шкалам используемым в РА. Вторым ограничением в применении РА является то, что обе переменные должны находится по отношению друг к другу либо в функциональной, либо в статистической зависимости. Если одна из случайных величин является константой, то РА теряет смысл: коэффициент регрессии окажется равен нулю, а на графике линия регрессии будет выражаться прямой, параллельной оси X.


10. ФАКТОРНЫЙ АНАЛИЗ

 

10.1. Общие сведения. Факторный анализ (далее - ФА) - комплекс аналитических методов, позволяющих выявить скрытые (латентные) признаки какого-либо явления или события, его внутреннюю (чаще всего скрытую) структуру. Возникновение ФА было связано с одной стороны с осознанием того, что множество явлений психологического или социального характера имеет сложную природу, а с другой стороны, с внедрением статистических методов в общественные науки. ФА представляет особую гордость психологов, поскольку его появление и развитие связано с именами Чарльза Спирмена (1863-1945) и Лайонела Терстоуна (1887-1955), которые были известными учеными-психологами. Немалая заслуга внедрения ФА в психологию принадлежит Р.Б.Кеттелу и Г.Ю.Айзенку, создавшим на основе применения этого метода факторные теории личности.

10.2. Задачи факторного анализа. ФА предназначен для исследования явлений, событий или объектов имеющих сложную структуру со множеством внутренних связей. Большинство психических явлений, особенно интеллект, личность, мотивация и т.д. можно рассматривать именно так. Поскольку такие явления могут быть измерены сразу по многим переменным, ФА позволяет совершить переход от множества непосредственно измеренных признаков изучаемого явления к комплексным обобщенным факторам, за которыми стоят комбинации исходных признаков. Например, об уровне интеллекта ученика могут свидетельствовать оценки по учебным предметам, результаты исследования внимания, памяти, мышления и т.д., однако множество измерений отдельных переменных, информация по которым может оказаться избыточной, можно свести к сравнительно небольшому набору факторов, которые будут также хорошо описывать интеллект, как и исходные переменные, и при этом, что очень важно, информативность такого описания будет не ниже, чем при использовании полного набора исходных переменных.

Главной задачей ФА, таким образом, является уменьшение объема статистического описания какого-либо явления без потери информативности такого описания. Из всего многообразия статистических методов ФА, пожалуй, более, чем какой-либо другой, учитывая системность изучаемых явлений, отвечает предмету психологии.

10.3. Процедура факторного анализа.

10.3.1. Исходными данными для ФА является таблица результатов измерения множества индивидов (объектов) по множеству переменных (шкал, тестов и т.д.). Например, это может быть исследование множества учеников по множеству тестов умственных способностей, или исследование случайных испытуемых по множеству шкал, отражающих личностные характеристики. Предполагается, что результаты измерения отражают общую структуру исследуемого явления, а результаты отдельного испытуемого представляют собой частный случай реализации общей структуры. С другой стороны, каждая отдельная шкала по которой были измерены множество индивидов также вносит свой вклад в общую структуру исследуемого явления. Уменьшение числа испытуемых может приводить к меньшей точности ФА, а уменьшение числа исходных шкал - к обеднению структуры исследуемого явления. Поэтому, ФА предполагает обработку достаточно большого объема информации, и его развитие оказалось тесно связано с появлением электронно-вычислительных машин. В общем виде таблица результатов эксперимента, которые впоследствии подвергаются ФА имеет следующий вид:

  1 тест 2 тест 3 тест . k -й тест
1 индивид X1,1 X1,2 X1,3 . X1,k
2 индивид X,2,1 X,2,2 X,2,3 . X,2,k
3 индивид X3,1 X3,2 X3,3 . X3,k
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
n-й индивид Xn,1 Xn,2 Xn,3 . Xn,k

Рис. 10.1 Таблица результатов эксперимента для ФА.

 

10.3.2. Второй этап ФА - подсчет коэффициентов корреляции между всеми исходными переменными (т.е. каждой переменной с каждой), в результате чего получается матрица корреляций между переменными, или, по-другому, матрица интеркорреляций.

  1 тест 2 тест 3 тест . k -й тест
1 тест r1,1 r1,2 r1,3 . r1,k
2 тест r2,1 r2,2 r2,3 . r2,k
3 тест r3,1 r3,2 r3,3 . r3,k
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
k -й тест rk,1 rk,2 rk,3 . rk,k

Рис 10.2. Общий вид матрицы интеркорреляций

 

При этом интеркорреляционная матрица всегда имеет одинаковое количество строк и столбцов, симметрична относительно главной диагонали (где расположены элементы с одинаковыми подстрочными индексами) и элементами главной диагонали всегда являются единицы (коэффициент корреляции переменной с самой собой всегда равен «1.00»).

10.3.3. Третий этап ФА - получение редуцированной корреляционной матрицы. Она отличается от матрицы попарных корреляций тем, что по ее диагонали находятся не единицы, а т.н. ''общности'' или ''запасы общей изменчивости'' - наибольшие значения коэффициента корреляции (по модулю) в столбце (строке) соответствующей данной переменной.

10.3.4. На четвертом этапе подсчитывается сумма коэффициентов корреляции в каждом столбце и общая сумма всех элементов матрицы интрекорреляций. В том случае, если хотя бы одна из сумм оказывается отрицательной, необходимо изменить знак всех коэффициентов корреляции в данном столбце (строке) на противоположный. Такая процедура равносильна повороту шкалы измерения данной переменной на 180 градусов, т.е там где был плюс становится минус и наоборот.

10.3.5. На пятом этапе необходимо определить факторные нагрузки каждой переменной на первый фактор. Для этого каждую сумму делят на корень квадратный из общей суммы всех коэффициентов корреляции в матрице:

 

Поскольку количество факторных нагрузок каждой переменной на первый фактор равно количеству исходных переменных, то в результате вычислений получается матрица факторных нагрузок размерностью 1X n (где n – число исходных переменных) иначе называемая вектор-строка.

10.3.6. Полученную матрицу факторных нагрузок необходимо умножить на транспонированную матрицу факторных нагрузок, представляющую собой вектор-столбец (размерностью n X 1). Результатом таких вычислений является матрица попарных произведений факторных нагрузок размерностью n X n.

10.3.7. На следующем этапе необходимо из редуцированной корреляционной матрицы вычесть матрицу попарных произведений факторных нагрузок, что означает вычитание из каждого элемента первой матрицы каждого соответствующего элемента второй. Результатом этого этапа является остаточная матрица.

10.3.8. На последнем этапе остаточная матрица проверяется на соответствие матрице погрешностей, что означает установление необходимости дальнейшей факторизации. Для этой процедуры обычно используется критерий Сондерса или уравнения Терстоуна (см. Г.В.Суходольский “Основы математической статистики для психологов”). Если обнаруживается, что остаточная матрица не соответствует матрице погрешностей, то весь алгоритм ФА повторяется сначала, но уже с остаточной матрицей, в результате чего получается матрица факторных нагрузок переменных на второй фактор, затем на третий и т.д. Вся процедура ФА может повторяться, таким образом, до тех пор, пока остаточная матрица не станет соответствовать матрице погрешностей, но при этом, количество полученных в ФА факторов в любом случае будет меньше, чем количество исходных переменных.

10.4. Результаты ФА. Завершающий этап ФА - получение факторной матрицы (матрицы факторных нагрузок каждой переменной на каждый фактор), подсчет процента дисперсии, приходящейся на каждый фактор, а далее - построение факторной диаграммы. При этом считается что:

1. Факторы определены через исходные переменные;

2. Система факторов образует пространство, в котором через факторные нагрузки определены исходные переменные;

3. Факторы ранжированы в порядке убывания их значимости для объяснения эмпирических результатов;

4. Количество факторов существенно меньше, чем исходных переменных;

5. Факторам придается смысл скрытых источников, порождающих эмпирические результаты;

6. Все факторы независимы друг от друга.

10.5. Построение факторных диаграмм. Исходным предположением для построения факторной диаграммы является то, что факторы не коррелируют между собой и представляют оси многомерного факторного пространства, где переменные можно представить в виде векторов или точек с координатами, соответствующими факторным нагрузкам каждой переменной на каждый из полученных факторов. Как правило, при построении факторной диаграммы ограничиваются двумя первыми факторами, поскольку на плоскости трудно изобразить пространство большей размерности.

Факторные нагрузки, при этом, - не что иное, как координаты точек исходных переменных в пространстве полученных факторов.

 

10.6. Эмпирический пример ФА. В качестве эмпирического примера ФА взяты результаты исследования эмоциональной устойчивости 38 испытуемых, проведенные при помощи 9 тестов, дающих 10 исходных переменных. Это были бланковые тесты-опросники (первые 8 переменных) и компьютерный мнемический тест (КМТ), в котором создавался стресс неуспеха, дающий две переменные – количество правильных ответов и время реакции или время воспроизведения правильных ответов (см. рис.10.3).

Испытуемые Пластичность ЦНС Эмоциональная чувствительность Ситуативная тревожность Личностная тревожность Нейротизм Мотивация достижения Нетерпимость неопределенности Стратегия выхода из крит. ситуаций Кол-во правильных ответов в КМТ Время реакции в КМТ
Г.И.     1,80 1,95       0,75   6,07
В.В.     2,25 3,45       0,60   5,30
Б.Я.     1,95 1,95       0,60   4,83
Е.Б.     1,90 2,15       0,52   8,06
К.В.     2,65 1,70       0,77   3,86
О.А.     2,20 3,15       0,56   6,36
Е.В.     2,00 2,45       0,56   7,90
Е.А.     1,90 2,75       0,49   6,01
В.Б.     2,00 2,50       0,60   5,56
В.В.     3,00 2,90       0,48   4,68
О.М.     2,90 3,55       0,43   4,61
Н.П.     1,75 2,25       0,60   6,02
Т.В.     2,70 3,00       0,67   5,13
О.В.     2,05 2,35       0,59   7,15
З.Л.     3,45 3,10       0,56   4,97
Л.В.     3,60 2,50       0,68   4,72
Е.В.     2,05 2,25       0,74   6,64
Н.А.     2,10 2,15       0,55   6,07
Л.А.     2,45 2,80       0,59   6,12
Н.В.     3,00 3,00       0,63   7,13
А.Ю.     1,75 1,70       0,82   4,60
В.Н.     3,05 2,40       0,57   4,58
Е.В.     1,90 2,60       0,57   5,98
Л.В.     1,25 1,70       0,65   5,75
С.В.     2,95 3,25       0,51   4,01
Б.В.     1,55 2,10       0,61   5,17
А.Л.     1,85 2,15       0,56   4,51
Ж.И.     2,25 2,80       0,54   5,87
А.В.     3,10 3,35       0,47   4,51
Ю.В.     1,70 2,05       0,64   3,79
Б.Г.     2,05 2,35       0,58   5,05
А.П.     1,45 2,60       0,60   2,61
Н.А.     1,85 1,90       0,63   3,37
Д.Е.     2,35 2,20       0,57   4,05
А.И.     1,60 2,50       0,53   4,24
О.А.     1,75 1,90       0,63   6,20
И.П.     1,55 1,80       0,85   5,62
М.В.     1,35 1,40       1,06   5,84

Рис. 10.3. Таблица результатов эксперимента

 

Здесь необходимо отметить, что эмоциональная устойчивость имеет сложную, многофакторную природу, что и предопределило выбор исходных переменных. В действительности, в этом эксперименте было 23 исходных переменных, т.к. компьютерный мнемический тест состоял из трех серий, результаты которых тоже содержали несколько переменных времени реакции и количества ответов, однако, в качестве учебного примера их количество было сокращено (были взяты только средние арифметические времени реакции и количества правильных ответов).

После подсчета коэффициентов корреляции была получена матрица интеркорреляций:

Переменные Пластичность ЦНС Эмоциональная чувствительность Ситуативная тревожность Личностная тревожность Нейротизм Мотивация достижения Нетерпимость неопределенности Стратегия выхода из крит. ситуаций Кол-во правильных ответов в КМТ Время реакции в КМТ  
Пласт. ЦНС   1,000 -0,475 -0,173 -0,474 -0,508 0,561 -0,417 0,472 0,027 -0,042 -1,029
Эмоцион. чувств. -0,475 1,000 0,538 0,716 0,762 -0,509 0,461 -0,558 -0,207 0,117 0,846
Ситуативн. тревожность -0,173 0,538 1,000 0,633 0,539 -0,272 0,111 -0,349 -0,464 -0,125 0,438
Личностная тревожность -0,474 0,716 0,633 1,000 0,751 -0,578 0,282 -0,658 -0,467 -0,020 0,183
Нейротизм   -0,508 0,762 0,539 0,751 1,000 -0,562 0,542 -0,597 -0,346 -0,012 0,568
Мотивация достижения 0,561 -0,509 -0,272 -0,578 -0,562 1,000 -0,410 0,631 0,300 -0,054 -0,893
Нетерпим. неопредел. -0,417 0,461 0,111 0,282 0,542 -0,410 1,000 -0,369 -0,101 0,347 0,447
Стратегия вых. из КС 0,472 -0,558 -0,349 -0,658 -0,597 0,631 -0,369 1,000 0,230 0,029 -1,168
К-во ответов в КМТ 0,027 -0,207 -0,464 -0,467 -0,346 0,300 -0,101 0,230 1,000 -0,223 -1,253
Время реакц. в КМТ -0,042 0,117 -0,125 -0,020 -0,012 -0,054 0,347 0,029 -0,223 1,000 0,018
Суммы   -1,029 0,846 0,438 0,183 0,568 -0,893 0,447 -1,168 -1,153 0,018 -1,842

Рис. 10.4. Матрица интеркорреляций

 

В данном случае хорошо видно, что общая сумма всех коэффициентов корреляции в матрице равна ''-1,842'', а по условию ФА она должна быть больше нуля (иначе невозможно подсчитать факторные нагрузки) и поэтому необходима инверсия тех шкал, у которых сумма коэффициентов корреляции отрицательна. Инверсия шкалы ''Стратегия выхода из критических ситуаций'' привела к тому, что общая сумма стала положительной, и в матрицу коэффициентов корреляции были включены ''запасы общей изменчивости'':

Переменные Пластичность ЦНС Эмоциональная чувствительность Ситуативная тревожность Личностная тревожность Нейротизм Мотивация достижения Нетерпимость неопределенности Стратегия выхода из крит. ситуаций Кол-во правильных ответов в КМТ Время реакции в КМТ  
Пласт. ЦНС   0,561 -0,475 -0,173 -0,474 -0,508 0,561 -0,417 -0,472 0,027 -0,042 -1,412
Эмоцион. чувств. -0,475 0,762 0,538 0,716 0,762 -0,509 0,461 0,558 -0,207 0,117 2,723
Ситуативн. тревожность -0,173 0,538 0,633 0,633 0,539 -0,272 0,111 0,349 -0,464 -0,125 1,768
Личностная тревожность -0,474 0,716 0,633 0,751 0,751 -0,578 0,282 0,658 -0,467 -0,020 2,251
Нейротизм   -0,508 0,762 0,539 0,751 0,762 -0,562 0,542 0,597 -0,346 -0,012 2,524
Мотивация достижения 0,561 -0,509 -0,272 -0,578 -0,562 -0,631 -0,410 -0,631 0,300 -0,054 -2,786
Нетерпим. неопредел. -0,417 0,461 0,111 0,282 0,542 -0,410 0,542 0,369 -0,101 0,347 1,726
Стратегия вых. из КС -0,472 0,558 0,349 0,658 0,597 -0,631 0,369 0,658 -0,230 -0,029 1,826
К-во ответов в КМТ 0,027 -0,207 -0,464 -0,467 -0,346 0,300 -0,101 -0,230 -0,467 -0,223 -2,180
Время реакц. в КМТ -0,042 0,117 -0,125 -0,020 -0,012 -0,054 0,347 -0,029 -0,223 0,347 0,307
Суммы   -1,412 2,723 1,768 2,251 2,524 -2,786 1,726 1,826 -2,180 0,307 6,747

Рис. 10.5. Редуцированная матрица интеркорреляций

 

Затем по формуле в п.10.3.5. были вычислены факторные нагрузки:

Переменные Пластичность ЦНС Эмоциональная чувствительность Ситуативная тревожность Лично



Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.2 сек.