КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Проверка эмпирического распределения на его соответствие нормальному распределению 2 страница
Порядок расчета эмпирического значения критерия следующий: 1. Проранжировать все измерения, объединив результаты выборок. Наименьшему значению из всех присваивается ранг 1, наибольшему - N = n1+n2+.... Если два или большее количество значений равны, то для них рассчитывается средний ранг, как это делали, рассматривая критерий Манна-Уитни. 2. Подсчитать сумму рангов отдельно для первой (SR1), второй (SR2) третьей (SR3) и других выборок. Проверить, совпадает ли общая сумма рангов с расчетной по формуле SR1+SR2+SR3+ +...=N(N+1)/2, где N= n1+n2+n3+... - общее число ранжируемых значений. 3. Рассчитать эмпирические значения критерия Вилкоксона для множественных значений. За эмпирические значения принимаются разности сумм рангов между всеми выборками попарно. Результаты удобно представить в виде матрицы. В заголовках строк и столбцов такой матрицы находятся названия выборок и суммы рангов для каждой из них, а на пересечении строк и столбцов матрицы указываются абсолютные значения разностей, показывающие, насколько отличаются суммы рангов соответствующих выборок. Матрица получается симметричной относительно главной диагонали, в ячейки главной диагонали нули можно не записывать. 4. Сравнить эмпирические значения критерия с критическими, приведенными в соответствующей таблице (Таблица 7 Приложения). Если эмпирическое значение больше ли равно критическому, то принимается альтернативная гипотеза, если меньше - то нулевая. Задача: В одной из школ Ленинградской области ученики 10 и 11 класса выполнили задания ШТУР (Школьный тест умственного развития). Различаются ли ученики - юноши и девушки из 10 и 11 классов по уровню общей осведомленности? Н0: уровень общей осведомленности у юношей и девушек из 10 и 11 классов значимо не различается. Н1: показатели уровня общей осведомленности у юношей и девушек из 10 и 11 классов различаются значимо. Таблица 12
* - для данных групп использованы случайные выборки по 15 человек из имеющихся результатов ШТУР. Таблица 13
Tкр.=246 (a=0.05) Т эмп > Tкр только в одном случае (девушки 10 класса и юноши 11 класса). Ответ: различия в уровне общей осведомленности значимы между девушками 10 класса и юношами 11 класса (a=0.05).
7.4 Сравнение уровня признака в зависимых выборках
При сопоставлении уровня результатов в двух зависимых выборках, когда измерения производятся на одних и тех же испытуемых в различных условиях X и Y, следует учитывать взаимозависимость результатов у каждого отдельного испытуемого. Формула t-критерия Стьюдента при решении задачи такого рода имеет вид
где di = xi - yi, т.е. разности значений признака для каждого испытуемого. Следует различать S (di2) - сумму квадратов di - и (S di) 2 - квадрат суммы di.
Количество степеней свободы определяется по формуле n = N-1 Корректное применение t-критерия предполагает, что распределение признака относится к нормальному типу. Альтернативная гипотеза принимается, если t эмп³ t кр. Задача сравнения результатов двух зависимых выборок предполагает направленное изменение результатов в ту или иную сторону, поэтому критические значения t кр берутся из колонки для одностороннего критерия. В программе Microsoft Excel расчет эмпирического значения критерия Стьюдента для зависимых выборок выполняется с использованием встроенного «Парного двухвыборочного t-теста для средних». Чтобы воспользоваться встроенной функцией Microsoft Excel надо войти в раздел «Анализ данных» из меню «Сервис», где и выбрать «Парный двухвыборочный t-тестдля средних». На экране высвечивается меню «Парного двухвыборочного t-теста для средних», в котором задаются интервалы обеих переменных, вероятность ошибки первого рода Альфа и выходной интервал (номер левой верхней ячейки выходного интервала). Гипотетическая средняя разность равна нулю по умолчанию. Выходные данные включают средние арифметические значения переменных в выборках, значения дисперсии, количество наблюдений в выборках, коэффициент линейной корреляции Пирсона, число степеней свободы, эмпирическое значение t-критерия и критические значения для одностороннего и двустороннего критериев.
Задача: Учащиеся старших классов выполняли тест ADOR в десятом, а затем через год в одиннадцатом классе. Увеличился ли за это время показатель враждебности к матери у девушек-учениц данной школы? Н0: уровень враждебности к матери у девушек в 11 классе значимо не выше такового в 10 классе. Н1: показатели уровня враждебности к матери у девушек в 11 классе выше уровня враждебности, который был за год до этого - в 10 классе.
Таблица 14
Если измерения проводились на двух зависимых выборках, но распределение признака хотя бы в одной из них оказалось отличным от нормального, либо недостаточным является объем выборок, то для оценки значимости изменений в этом случае используется непараметрический Т-критерий Вилкоксона для попарных сравнений. Т-критерий Вилкоксона применяется для признаков, измеренных в шкалах рангов, интервалов или отношений в двух различных условиях на одной и той же группе испытуемых. Критерий используется при минимальном количестве испытуемых 5 человек, а максимальное количество - 50 испытуемых (это ограничение связано с тем, что для большего числа испытуемых критические значения критерия не рассчитаны). Вычисления производятся в следующей последовательности: 1. Находится разность результатов для каждого испытуемого: из результата при условии 2 вычитается результат при условии 1. 2. Полученные разности ранжируются от наименьшего к наибольшему по абсолютной величине. Нулевые разности не учитываются. 3. Отдельно записываются ранги положительных и отрицательных разностей и суммируются отдельно. Правильность подсчета суммы рангов проверяется так же, как в критерии Манна-Уитни. 4. В качестве эмпирического значения принимается наименьшая сумма рангов. 5. Эмпирическое значение Т-критерия сравнивается с табличными значениями критических значений для a=0.05 и a=0.01 (Таблица 8 Приложения) и числа испытуемых в исходной выборке. Нулевая гипотеза отклоняется, если Тэмп £ Ткрит. Аналогично приведенным выше задачам, если нас интересует только сам факт наличия изменений в выборке, то используются критические значения для двустороннего критерия, а если нам важна направленность изменений (при использовании Т-критерия Вилкоксона это случается чаще), то берутся критические значения для одностороннего критерия.
Задача: Учащиеся старших классов (юноши) выполняли тест ADOR в десятом, а затем через год в одиннадцатом классе. Увеличился ли за это время показатель враждебности к отцу у юношей - учеников данной школы?
Н0: уровень враждебности к отцу у юношей в 11 классе не выше такового в 10 классе. Н1: показатели уровня враждебности к отцу у юношей в 11 классе значимо выше уровня враждебности, который был за год до этого - в 10 классе. Таблица 15
Т эмп.=18. Ткр.=19 (при a=0.01) Т эмп.< Ткр. (при a=0.01) Þ принимается альтернативная гипотеза. Ответ: показатель враждебности к отцу у учеников 11 класса значимо выше, чем он был за год до этого (р=0.01).
L-критерий Пейджа по своему назначению схож с Т-критерием Вилкоксона, с той разницей, что он применяется для сопоставления трех и более показателей, измеренных на одной и той же выборке испытуемых. При этом он не только констатирует наличие изменений, но и указывает их направление. Критерий позволяет проверить наши предположения об определенной возрастной или ситуативной динамике. Таблицы критических значений критерия рассчитаны лишь для небольших выборок (от 2 до 12 испытуемых) и ограниченное количество сопоставляемых замеров (до 6). Порядок действий при использовании L-критерия Пейджа следующий: 1. Проранжировать индивидуальные значения, полученные в первом, втором, третьем и т.д. замерах для каждого из испытуемых. Самому низкому значению присвоить ранг 1, самому высокому - наивысший, согласно числу замеров. 2. Просуммировать ранги по условиям, при которых выполнялись замеры. Проверить совпадение общей суммы рангов с расчетной по формуле SR=nc(c+1)/2, где n - число испытуемых, с - число замеров. 3. Расположить условия в таблице в порядке возрастания ранговых сумм. 4. Определить значение L по формуле L=S(Tj.j), где Tj- сумма рангов по данному условию, а j - порядковый номер, приписанный данному условию в упорядоченной последовательности условий. 5. По таблицам критических значений (Таблица 9 Приложения) определить критические значения L для данного количества испытуемых N и для данного количества условий с. Если L равен критическому значению или превышает его, то тенденция достоверна. Задача: Изменяется ли уровень тревожности испытуемых в течение дня? Таблица 16
Н0: уровень тревожности в течение дня значимо не изменяется. Н1: уровень тревожности в течение дня значимо повышается.
Таблица 17.
Результаты ранжирования по строкам и суммы рангов для каждого из условий приведены в таблице. Проверка по формуле SR = n c(c+1)/2=42 подтверждает правильность ранжирования. Колонки расположены в порядке возрастания ранговых сумм, поэтому колонка «утро» получает номер 1, колонка «день» номер 2 и «вечер» - номер 3. Теперь можно рассчитать эмпирическое значение L-критерия: Lэмп=10х1+12.5х2+19.5х3 = 93.5. Эмпирическое значение критерия Lэмп больше критического Lкр=93 для уровня доверительной вероятности 95%, поэтому можно принять альтернативную гипотезу. Ответ: тенденция увеличения уровня тревожности в течение дня является достоверной (a=0.05).
7.5 Оценка сходства-различия распределений признаков Для установления сходства - различия между эмпирическим и теоретическим распределениями (равномерным, нормальным или каким-то иным) используется c2- критерий Пирсона где fi - эмпирическая частота для интервала квантования, ft - теоретическая (ожидаемая) частота для того же интервала. Сравнение эмпирического распределения с нормальным уже рассмотрено ранее. При сравнении эмпирического распределения с равномерным теоретическая (ожидаемая) частота интервала квантования находится по простой формуле: Количество степеней свободы для сравнения эмпирического распределения с равномерным определяется по формуле n= k-1 где k - число групп или интервалов квантования. Задача: определить, равномерно ли распределяется число полученных учениками неудовлетворительных оценок по месяцам учебного года. Подсчитав по классному журналу «двойки» учеников, получили следующие результаты: Таблица 18.
Общее число «двоек» N=135. Если бы все они были распределены равномерно по 9 месяцам учебного года (k=9), то каждый месяц ученики получали бы 135/9=15 двоек. Это число 15 является теоретической частотой ft для расчета величины c2. Значения эмпирической частоты fi даны в условии задачи (таблица). Н0: Распределение неудовлетворительных оценок по месяцам учебного года не отличается значимо от равномерного. Н1: Распределение неудовлетворительных оценок по месяцам учебного года значимо отличается от равномерного. Рассчитываем критерий c2 Пирсона:
Критическое значение критерия c2 определяется по таблицам (Таблица 3 Приложения), в нашем случае при n=9-1=8 и a=0.05 оно будет равным 15.51, при a=0.10 c2кр. =13.36, и при a=0.20 c2кр. =11.03. Ответ: мы должны принять нулевую гипотезу и признать, что распределение двоек по месяцам статистически значимо не отличается от равномерного (a=0.20).
Непараметрический критерий l Колмогорова-Смирнова можно использовать для сравнения двух любых распределений, между собой. Критерий основан на сравнении накопленных частот в двух распределениях, упорядоченных по тому или иному принципу. Порядок применения критерия для сравнения двух эмпирических распределений следующий: 1. Упорядочить распределения по одному и тому же основанию (принципу). Например, рассматривая темперамент учащихся двух классов, мы в первый интервал заносим данные меланхоликов, затем во второй интервал - флегматиков, потом сангвиников и, наконец, холериков как в первой, так и во второй выборках. 2. Для каждого интервала распределения рассчитать относительную частоту
где fi - абсолютная частота интервала, а n - объем соответствующей выборки. 3. Рассчитать накопленные частоты, сложив fотн каждого интервала с относительными частотами всех предшествующих интервалов. Накопленная частота последнего интервала равна 1.00. 4. Рассчитать разность накопленных частот соответствующих интервалов двух распределений. Наибольшая по абсолютной величине (то есть без учета знака) из рассчитанных разностей используется для расчета эмпирического значения l
где (Sf1/n1 - Sf2/n2)max - наибольшая разность накопленных частот, а n1 и n2 - объем выборок. 5. Сформулировать нулевую и альтернативную гипотезы: Н0: Распределение 1 значимо не отличается от распределения 2. Н1: Распределение 1 значимо отличается от распределения 2. 6. Сравнить эмпирическое значение с критическим. Критические значения составляют: Таблица 19.
Если эмпирическое значение больше критического, то принимается альтернативная гипотеза, если меньше, то нулевая. Задача: Сопоставить профили распределения результатов ШТУР учениц 11 класса, показавших наилучший и наихудший результаты: Таблица 20
Н0: Профили распределения результатов ШТУР лучшей и худшей учениц значимо не отличаются друг от друга.
Дата добавления: 2014-12-27; Просмотров: 2649; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |