Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Решение. Нулевая гипотеза НО заключается в том, что отличие эмпирического распределения признака от равномерного распределения статистически незначимо




Нулевая гипотеза НО заключается в том, что отличие эмпирического распределения признака от равномерного распределения статистически незначимо. Если это предположение верно, то все 36 испытуемых с одинаковой вероятностью могли выбрать любой из четырех вариантов ответов. Значит, теоретическая частота равна .

Таблица 4.3

  Частоты Значения признака
Очень важный Важный Маловажный Совсем не важный Итого
         
         

 

Вычислим эмпирическое значение критерия по формуле (4.1):

Найдем по таблице критическое значение «хи-квадрат» для уровня значимости и числа степеней свободы . Так как , т.е. 2,22<7,815, то наблюдаемые значения согласуются с нулевой гипотезой и не дают оснований ее отвергнуть. Значит, с ошибкой 5% можно утверждать, что в генеральной совокупности значения признака распределены равномерно.

 

 

Задача 2. Пользуясь критерием «хи-квадрат» Пирсона, проверить гипотезу о нормальном распределении значений признака, сгруппированных в интервалы одинаковой длины.

 

Таблица 4.4

Интервалы 5-9 10-14 15-19 20-24 25-29 30-34
Частоты            

 

Решение

Шаг 1. Выберем уровень значимости . Гипотезы:

: Эмпирическое распределение признака соответствует нормальному закону.

: Эмпирическое распределение признака статистически достоверно отличается от нормального распределения.

Шаг 2. Вычислим числовые характеристики выборки - выборочную среднюю и выборочное среднее квадратическое отклонение . Для этого выберем в каждом интервале середину интервала в качестве «представителя»: , , , , , .

 

;

; тогда .

Шаг 3. Вычислим вероятности попадания значений признака в частичные интервалы , что нужно для вычисления теоретических частот .

 

;

;

;

;

;

;

;

.

Шаг 4. Заполним расчетную таблицу и найдем эмпирическое значение критерия «хи-квадрат» по формуле (4.1).

 

Таблица 4.5

Интервалы Эмпирические частоты Вероятности Теоретические частоты = Слагаемые
  0,0166 0,64 0,64
  0,0416 1,66 3,29
  0,1130 4,52 0,05
  0,1990 7,96 0,00
  0,2179 8,72 0,59
  0,1447 5,79 0,84
  0,0598 2,39 1,08
  0,0287 1,15 1,15
Сумма - -

 

В правом нижнем углу таблицы находится искомое эмпирическое значение .

Шаг 5. Находим критическое значение для уровня значимости и числа степеней свободы (предполагаемое нормальное распределение имеет параметра), используя таблицу 9 (см. Приложения).

Шаг 6. Делаем выводы. Так как , то на уровне значимости нет оснований отрицать соответствие между эмпирическим и нормальным распределениями признака (принимается гипотеза ). Расхождения между эмпирическим распределением признака и нормальным распределениями статистически недостоверны.

Замечание. Вычислять теоретические частоты можно и по формуле

, (4.9)

где (– середины интервалов). В задаче 2: , , , , при этом используется таблица значений функции .

 


 

Лекция 10. Сравнение эмпирических распределений признака

 

Содержание

1. Сравнение двух эмпирических распределений признака

2. Сравнение более двух эмпирических распределений признака

 

1. Сравнение двух эмпирических распределений признака

 

На разных этапах психологического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых утверждений (гипотез), от которых зависит правомерность и эффективность применяемых методов анализа. Например, при наличии нескольких групп исходных данных встает вопрос: можно ли считать, что выборки извлечены из одной генеральной совокупности, являются ли они однородными.

Выборки называются однородными, если они извлечены из одной и той же генеральной совокупности и, следовательно, имеют одинаковые законы распределения.

Задача сравнения распределений одного признака в двух и более выборках (задача определения однородности выборок) возникает, например, при сравнении результатов наблюдений в экспериментальной и контрольной группах.

Задача проверки однородности выборок равносильна задаче проверки гипотезы об отсутствии различия между двумя и более эмпирическими распределениями. Для установления однородности выборок можно использовать критерий однородности , который применим при (еще лучше, если выполняется условие ) и данные представлены в группированном виде.

 

Пусть имеются две выборки объемами и . Элементы каждой выборки независимы, непрерывны и сгруппированы в одинаковых интервалов. Требуется определить, принадлежат ли выборки одной генеральной совокупности.

Проверяемая гипотеза : Выборки принадлежат одной генеральной совокупности, т.е. имеют одинаковые, но неизвестные функции распределения.

Альтернативная гипотеза : Выборки принадлежат разным генеральным совокупностям и имеют различные законы распределения.

Для вычисления используются различные модификации формулы расчета (4.1), что позволяет облегчить процесс вычисления. Ниже в задачах приведены различные формулы вычисления эмпирического значения в зависимости от числа сравниваемых выборок и способа представления исходных данных.

После заполнения расчетной таблицы критерия «хи-квадрат»нужно определить число степеней свободы , где - число интервалов (альтернатив, ответов испытуемых и так далее), - число сравниваемых распределений и найти критическое значение (см. таблицу 9 Приложения). Если , то расхождения между распределениями статистически недостоверны (на уровне значимости принимается гипотеза ). Если , то расхождения между распределениями статистически достоверны.

 

Начнем изучение сравнения двух эмпирических распределений () с простого случая, когда признак измерен в дихотомической шкале (). Исходные данные двух эмпирических распределений для сравнения между собой могут быть представлены различными способами. Наиболее простой способ – «четырехпольная таблица». Отметим, что в этом случае формула для вычисления может быть различной.

 

Задача 1. После окончания двух институтов экономического профиля трудоустроились по специальности из первого института 90 человек, а из второго 80 (обе группы молодых специалистов включали по 100 человек).

Имеются ли достоверные различия по успешности трудоустройства выпускников одного вуза?

Решение

Рассмотрим гипотезу об отсутствии достоверных различий по ус­пешности трудоустройства выпускников вузов. Уровень значимости примем равным 0,05.

Первый способ вычисления - с использованием формулы

. (4.10)

Представим исходные данные в виде четырехпольной таблицы.

 

Таблица 4.6 – Фактические значения частот признака

Значения признака (альтернативы) Первый вуз Второй вуз Итого
Трудоустроились А =90 В =80 А+B=170
Не трудоустроились C =10 D =20 C+D=30
Всего А+C=100 B+D=100 А+B+C+D=200

 

В таблице ожидаемых теоретических частот признака (таблица 4.7) вычислены теоретические значения частот, которые равны отношению произведений итогов по строкам и столбцам к общему итогу.

 

Таблица 4.7 - Ожидаемые теоретические частоты признака

Значения признака Ожидаемые частоты значений признака Итого
Первый вуз Второй вуз
Трудоустроились = = = =  
Не трудоустроились = = = =  
Итого (проверка)      

 

Теоретическая частота показывает число выпускников первого вуза, которые должны были бы трудоустроиться, а - которые не должны были трудоустроиться, и так далее.

 

Таблица 4.8 - Расчетная таблица для вычисления

Значения признака (альтернативы) Эмпирическая частота Ожидаемая теоретическая частота  
Трудоустрои­лись Вуз 1     90-85 = 5 0,29
Вуз 2     80-85 = -5 0,29
Не трудоуст­роились Вуз 1     10-15 = -5 1,67
Вуз 2     20-15 = 5 1,67
Всего Итого      

 

.

Вычислим число степеней свободы по формуле , где - число альтернатив, - число сравниваемых выборок. По таблице критических значений «хи-квадрат» находим .

 

Область Область

незначимости значимости различий

различий распределений распределений

 

 

Рисунок 4.2

 

Значение попало в «область значимости различий», значит, с надежностью 0,95 можно говорить о наличии достоверных различий эмпирических распределений признака «ус­пешность трудоустройства выпускников вузов». Наблюдаемые различия между трудоустройством выпускников вузов не случайны, и вузы можно считать значимо отличающимися по успешности трудоустройства выпускников.

 

Рассмотрим второй способ вычисления эмпирического значения критерия для случая дихотомического признака () для двух выборок () – по формуле

, (4.10)

где - или общее число испытуемых в обеих выборках.

Задача 2. Различаются ли распределения мужских и женских имен в записной книжке у психолога Х и психолога У?

 

Психолог Количество имен в записных книжках психологов
Мужские имена Женские имена
Психолог Х    
Психолог У    

 

Решение

Исследуемый признак «имена в записных книжках психологов» измерен в дихотомической шкале, значит, . Исследуется две записные книжки – значит, число сравниваемых выборок равно . Проверим гипотезу об отсутствии различия между двумя эмпирическими распределениями, то есть что выборки однородны.

Исходные данные представлены в виде четырехпольной таблицы. Подставим исходные данные , , , , в формулу (4.10), получаем:

.

Число степеней свободы равно , уровень значимости выберем . По таблице критических значений «хи-квадрат» находим .

Значение , поэтому на уровне значимости 0,05 нет оснований отвергнуть гипотезу об отсутствии статистически значимого различия между двумя эмпирическими распределениями. Это означает, что выборки однородны.

 

Теперь решим задачу, в которой сравниваются две выборки (), имеющие более двух возможных значений признака (). Будем считать, что каждая выборка сгруппирована в одинаковых интервалов.

 

Таблица 4.10 – Распределение значений признака в двух выборках

Интервалы Объем выборки
Частоты значений признака Первая выборка
Вторая выборка

 

Подсчет эмпирического значения критерия для такого случая осуществляется по формуле

, (4.11)

где и - количество попаданий в -й интервал группирования соответственно первой и второй выборок объемами и ; - количество интервалов группировки.

Равносильная для (4.11) формула имеет вид:

. (4.12)

Заметим, что для выборок одинакового объема формула (4.12) примет вид

. (4.13)

Критическое значение находится по таблице. Чем меньше расчетное значение , тем более благоприятные условия складываются для принятия гипотезы об однородности двух выборок. При гипотеза принимается, в противном случае – отвергается.

Задача 3. В двух факультетах одного вуза выяснялась успешность знания студентами высшей математики. Для этого случайным образом в обоих факультетах отобраны студенты и с ними проведено компьютерное тестирование. Знания оценивались по 100-балльной шкале. Результаты тестирования приведены в таблице.

Проверить предположение о том, что существенного различия в уровне математических знаний студентами разных факультетов не существует.

 

Таблица 4.11

Факультеты Количество студентов, набравших баллы, и их оценки   Суммы
Менее 55 баллов «2» От 56 до 70 баллов «3» От 71 до 85 баллов «4» От 86 до 100 баллов «5»
Химический (50 студентов)   =3 =20 =18 =9
Механический (50 студентов)   =8 =19 =10 =3
Суммы          

 

Решение

Анализ данных таблицы показывает, что на химическом факультете примерно в три раза меньше студентов, получивших «2», и в три раза больше студентов, получивших «5». Но вывод, что студенты химического факультета показывают в целом лучшие результаты, чем студенты механического, можно делать только после статистической обработки данных.

Приведем расчетную таблицу критерия «хи-квадрат» для сравнения двух эмпирических распределений по формуле (4.12).

 

Таблица 4.12

Интервалы группирования признака Эмпирические частоты Слагаемые
Для химического факультета Для механического факультета
Менее 55 баллов =3 =8 = 871,1
От 56 до 70 баллов =20 =19 = 250
От 71 до 85 баллов =18 =10 = 537,8
От 86 до 100 баллов =9 =3 = 490
Сумма =50 =40

 

 

Подставим данные задачи в формулу (4.12), получим:

Эмпирическое значение меньше к ритического значения , то есть полученные различия попали в область незначимости. Иными словами, следует принять нулевую гипотезу «о сходстве», что уровень математических знаний студентов двух факультетов статистически значимо не отличается между собой.

Выше, при визуальном анализе экспериментальных данных было высказано предположение, что студенты химического факультета показывают в целом лучшие результаты, чем механического. Но критерий «хи-квадрат» показал, что это не так.

 


 

2. Сравнение более двух эмпирических распределений признака

 

Рассмотрим задачу, в которой имеется три выборки по четыре значения признака в каждой. Для расчета эмпирического значения критерия воспользуемся формулой (4.10) .

Задача 4. Для изучения отношения студентов к новой форме проведения занятий по математике случайным образом опросили 120 студентов II курса трех факультетов – гуманитарного, экономического и химического.

Имеются ли различия во мнениях респондентов?

 

Таблица 4.13 - Отношение студентов к занятиям по математике

Альтернативы(варианты ответов) Факультеты Всего
Гуманитарный Экономический Химический
Весьма положительно А 5 Б 8 В 18  
Положительно Г 7 Д 10 Е 15  
С сомнением Ж 11 З 6 И 6  
Отрицательно К 15 Л 10 М 9  
Всего          

 

Решение

Рассмотрим основную гипотезу об отсутствии в генеральной совокупности значимых различий во мнениях студентов трех факультетов. Альтернативная гипотеза – о том, что существует значимая статистическая взаимосвязь между тем, на каком факультете учится студент, и тем, как он оценивает новые формы проведения занятий по математике. Уровень значимости примем равным 0,05.

Для нахождения ожидаемой теоретической частоты значенийравномерно распределенного признака значения для каждой клетки таблицы перемножим соответствующие частоты, представленные в итоговом столбце и итоговой строке, и разделим на общее число респондентов (120). Например, ожидаемая частота для клетки (А) равна ; для клетки (Д) - и т.д.

Для расчета заполним таблицу, в которой альтернатива «Весьма положительно» в таблице включает альтернативы для всех факультетов.

 

Таблица 4.14 - Ожидаемые теоретические частоты признака

Альтернативы(варианты ответов) Факультеты Всего
Гуманитарный Экономический Химический
Весьма положительно = = =  
Положительно = = =  
С сомнением = З =  
Отрицательно = = =  
Всего          

 

Теперь заполним расчетную таблицу для вычисления эмпирического значения критерия «хи-квадрат».

Таблица 4.15 – Схема вычисления

Альтернативы Эмпирические частоты Теоретические частоты
Весьма положительно А   9,8 -4,8 2,351
Б   8,8 -0,8 0,073
В   12,4 5,6 2,529
Положительно Г   10,1 -3,1 0,951
Д   9,1 0,9 0,089
Е   12,8 2,2 0,378
С сомнением Ж   7,3 3,7 1,875
З   6,5 -0,5 0,038
И   9,2 -3,2 1,113
Отрицательно К   10,8 4,2 1,633
Л   9,6 0,4 0,017
М   13,6 -4,6 1,556
Всего      

 

Найдем число степеней свободы: , где k - число альтернатив, с - количество сравниваемых выборок.

По таблице критических значений распределения «хи-квадрат» находим .

Полученное значение больше . С достоверностью0,95принимается гипотеза о том, что существует значимая статистическая взаимосвязь между тем, на каком факультете учится студент, и тем, как он оценивает новые формы проведения занятий по математике.

 

Лекция 11. Многофункциональный критерий Фишера

(угловое преобразование Фишера)

 

Содержание

1. Понятие многофункционального критерия

2. Описание критерия - углового преобразования Фишера

 

 

1. Понятие многофункционального критерия

Многофункциональные критерии позволяют решить задачи трех типов:

1) сопоставление уровней исследуемого признака;

2) определение сдвигов в значениях признака;

3) сравнение распределений признака.

Ограничений на применение таких критериев мало:

· данные исследований могут быть представлены в любой шкале;

· выборки могут быть независимыми или зависимыми;

· границы выборок – от 5 наблюдений и выше.

Сущность любого из многофункциональных критериев состоит в определении того, какая доля наблюдений (испытуемых) в выборке характеризуется эффектом, интересующим исследователя.

К эффектам относят:

¨ определенное значение качественно определяемого признака (например, выражение «согласен»; выбор определенного ответа из предложенных);

¨ определенный уровень количественно измеряемого признака (оценка выше проходного балла; решение задачи менее чем за контрольное время);

¨ определенное соотношение значений или уровней исследуемого признака (более частый выбор альтернатив А и Б по сравнению В и Г; преобладание положительных сдвигов над отрицательными).

Многофункциональные критерии позволяют решать задачи сопоставлений (сравнения «уровней», оценки «сдвигов», сравнения распределений) путем сведения данных к шкале «есть эффект – нет эффекта».

 

2. Описание критерия - углового преобразования Фишера

 

Предназначен для сопоставления двух выборок по частоте встречаемости эффекта. Критерий (угловое преобразование Фишера) оценивает достоверность различий между процентными долями двух выборок, в которых зафиксирован данный эффект. Критерий позволяет определить, действительно ли одна из долей статистически достоверно превосходит другую при данных объемах выборок.

Угловое преобразование Фишера состоит в переводе процентных долей, выраженных в долях единицы (),в величины центрального угла , который измеряется в радианах: . При увеличении расхождения между углами и и увеличении численности выборок значение критерия возрастает. Чем больше величина , тем более вероятно, что различия достоверны.

 

Гипотезы:

: процентная доля лиц, у которых проявляется исследуемый эффект, в первой выборке не больше, чем во второй выборке;

: доля лиц, у которых проявляется исследуемый эффект, в первой выборке больше, чем во второй выборке.

 

Условия применения критерия Фишера

1. Измерение может быть проведено в любой шкале.

2. Нижняя граница объема выборок равна 2-5 (если в одной выборке 2 наблюдения, то в другой - не менее 30 наблюдений). Верхний предел объема выборок не существует

 

Описание действий

Шаг 1. Определить значения признака, которые будут критерием для разделения испытуемых на тех, у кого «есть эффект» и тех, у кого «нет эффекта».

Шаг 2. Заполнить четырехпольную таблицу.

 

Таблица 4.16

  Выборки Количество наблюдений и процентная доля Суммы
Есть эффект Нет эффекта  
Первая выборка  
Вторая выборка  
Суммы

 

Шаг 3. Подсчитать число испытуемых в каждой «ячейке» и перевести эти данные в проценты. Записать процентные доли в этих же «ячейках» в скобках. Если одна из сопоставляемых процентных долей «с эффектом» равна нулю, то необходимо сдвинуть «точку деления» в какую–либо сторону или отказаться от критерия и использовать критерий .

Шаг 4. Найти по таблице «Величины угла (в радианах) для разных процентных долей» (см. Приложения) величину угла (в радианах) для каждой из сопоставляемых процентных долей «есть эффект».

Шаг 5. Вычислить эмпирическое значение по формуле

, (4.14)

где - угол, соответствующий бóльшей процентной доле; - угол, соответствующий меньшей процентной доле; - объем первой выборки; - объем второй выборки.

Шаг 6. Найти критическое значение

Шаг 7. Построить «ось значимости» и сопоставить значение со значением .


Область Область

незначимости Область неопределенности значимости различий различий

процентных долей процентных долей

«эффекта» в выборках «эффекта» выборках

Рисунок 4.3

Шаг 8. Если , то на 5% уровне значимости нет оснований для отклонения гипотезы . С ошибкой 5% можно утверждать, что нет достоверных различий процентных долей лиц с «эффектом» в выборках.

Если , то на уровне значимости гипотеза отклоняется и принимается гипотеза . Можно говорить о достоверном различии между долями лиц с проявлением «эффекта» в выборках.

Если , то на 5%-м уровне значимости можно говорить о достоверном различии долей лиц с «эффектом» в выборках, а на уровне 1% этого утверждать нельзя.

 

Задача 5. Исследователя интересует, различаются ли две группы по успешности решения задания, если из 25 учащихся первой группы с заданием справились 15, а из 30 учащихся второй группы – 20 учащихся.

Решение

«Эффектом» служит значение «задание решено» качественного признака «успешность решения задания». Построим четырехпольную таблицу, в которой переведем показатели успешности решения задачи в проценты: ; .

Таблица 4.17

  Задание решено Задание не решено
Группа № 1 15 60%   15+10=
Группа № 2 20 66,7%   20+10=
Суммы 15+20=35 10+10=20 25+30=35+20=55

 

Найдем значения и , соответствующие процентным долям «эффекта» в каждой группе. Для значение ; для значение (по таблице «Величины угла (в радианах) для разных процентных долей». Вычислим эмпирическое значение

.

Область Область

незначимости значимости

различий различий

процентных долей процентных долей

эффекта «задание решено» эффекта «задание решено»

 

Рисунок 4.4

Так как для и , то можно утверждать, что нет оснований для отклонения гипотезы о незначимости наблюдаемых различий в долях учащихся двух групп, решивших задание. Поэтому процентные доли лиц, справившихся с заданием в группах, значимо не отличаются.

Е.В.Сидоренко отмечает, что «можно лишь посочувствовать исследователю, который считает существенными различия в 20% и даже 10%, не проверив их по критерию ». То, что кажется существенным исследователю, со статистической точки зрения может таковым не оказаться [8, с.163].

 

 




Поделиться с друзьями:


Дата добавления: 2014-10-17; Просмотров: 1490; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.