КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
П1] [п2] . Коэффициент корреляции Пирсона. Коэффициент детерминации. Прямая линия регрессии
Часто на практике каждый объект в выборке изучается по двум признакам Х и У с целью исследования зависимости между ними. Пример: Пусть Х – познавательная активность по предмету, У– успеваемость по этому же предмету учеников в классе. Допустим, сделана выборка объема n =5: ((3,3), (2,4), (1,5), (1,4), (4,3)). Здесь первое число в каждой паре – познавательная активность по предмету, а второе число в каждой паре есть успеваемость по этому предмету (в баллах). Каждая пара соответствует одному ученику. С целью графического изображения выборки по двум признакам Х и У строят корреляционное поле: в системе координат ХОУ отмечают точки с координатами (хi, уi). Для нашего примера корреляционное поле выглядит следующим образом:
х Для изучения зависимости между Х и У вычисляют выборочный коэффициент корреляции Пирсона rв :
ХУв – Х в Ув sв (Х) sв(У) Здесь ХУв – выборочная средняя произведения ХУв = (х1у1 + х2у2 + … + хnуn), Хв,Ув – выборочные средние признаков Х,У; sв (Х), sв(У) – выборочные средние квадратические отклонения. Всегда –1< rв <1. Если | r |>0,3, то зависимость сильная, если | r |<0,3, то зависимость слабая. Если r>0, то зависимость положительная: чем больше Х, тем больше У. Если r<0, то зависимость отрицательная: чем больше Х, тем меньше У.
Найдем выборочный коэффициент корреляции для нашего примера. Вычисления оформим в виде таблицы:
Отсюда Хв ==2,2; Ув = =3,8; Хв2 = = 6,2; Ув2 = =15; ХУв = =7,6 Дв(У)=15 – 3,82 = 0,56; Дв испр.(У)= 0,56= 0,7; sв испр. (У)» 0,84; Дв (Х) = 6,2 – 2,22 = 1,36; Дв испр. (Х) = 1,36 = 1,7; sв испр. (Х)»1,30; rв = » - 0,8. Вывод: Зависимость между познавательной активностью и успеваемостью сильная отрицательная: чем выше познавательная активность, тем выше успеваемость. Определение 6. Коэффициентом детерминации называется квадрат коэффициента корреляции d в = rв2 . В нашем примере d в = 0,64. Коэффициент детерминации, выраженный в процентах, показывает, какая доля изменчивости переменной У обусловлена изменчивостью переменной X. В корреляционном поле можно построить прямую линию, к которой точки корреляционного поля «наиболее близки». Эта прямая линия называется прямой линией регрессии. Ее уравнение имеет следующий вид: . Здесь ух – среднее значение у при данном х (ух – аналог переменной у в уравнении прямой у=кх+ в). В нашем примере уравнение регрессии принимает вид ух = 3,8 + (- 0,8) (х – 2,2), ух = - 0,45х + 4,79. Построим данную прямую в корреляционном поле по точкам
Ранговая корреляция Спирмена.
= 1- (*) Использование коэффициента корреляции Пирсона для изучения зависимости между X и Y предполагает выполнение некоторых условий на выборку, одно из которых – нормальность совместного распределения переменных X и Y.Поэтому в некоторых случаях целесообразно использовать ранговую корреляцию Спирмена или Кендалла. В ранговых корреляциях исследуется зависимость не между значениями переменных X и Y, а между рангами этих значений. К оэффициент ранговой корреляции Спирмена вычисляется по формуле
= 1- , Здесь n – объем выборки, а di - разность соответствующих рангов. Для вычислений рангов, разностей рангов и суммы квадратов разностей рангов удобно составлять расчетную таблицу. Пример. Вычислим коэффициент ранговой корреляции Спирмена для предыдущего примера. Составим расчетную таблицу.
В столбцах xi, yi записаны значения из выборки. В столбцах ai, bi мы запишем ранги переменных xi, yi соответственно. Сначала занумеруем значения xi, yi в порядке ухудшения качества: к каждому значению припишем его номер (в той же клетке таблицы).
В столбцах ai, bi мы запишем ранги: ранг значения равен его номеру, если значение встречается в выборке только один раз и ранг равен среднему арифметическому номеров всех одинаковых значений, если значение встречается несколько раз.
Проверка правильности вычисления рангов: сумма рангов по каждой переменной должна быть равна n(n+1)/2. В нашем примере это число равно 5(5+1)/2=15.Ранги вычислены верно. В столбце di записываем разности рангов di= ai - bi.
В столбце di2 записываем квадраты разностей рангов.
Находим сумму чисел последнего столбика di2 =2. 1 Подставляем полученные данные в формулу (*)
=1 - =1- =0,7. Выводы по коэффициенту ранговой корреляции аналогичны выводам по коэффициенту корреляции Пирсона rв. Всегда Если коэффициент ранговой корреляции больше нуля, то связь прямая: чем лучше качество по X, тем лучше качество по Y; Если коэффициент ранговой корреляции меньше нуля, то связь обратная: чем лучше качество по X, тем хуже качество по Y. В нашем примере коэффициент ранговой корреляции Спирмена больше нуля, связь прямая: чем выше познавательная активность учащихся, тем выше их успеваемость. Полный вывод: повышение познавательной активности учащихся существенно повышает их успеваемость.
Пример. Проверить согласованность оценок поведения детей родителями (X) и педагогом (Y).Поведение детей оценивалось по десятибалльной шкале (меньше –лучше). Выполнена выборка объема n=10.
Для исследования согласованности оценок мы вычислим коэффициент ранговой корреляции Спирмена. Составляем расчетную таблицу:
Выполним проверку правильности составления рангов: сумма рангов по каждой переменной должна быть равна 10(10+1)/2=55. Ранги вычислены верно. Находим сумму чисел последнего столбика di2 =11. Подставляем полученные данные в формулу (*): =1 - =1- =0,93 . Вывод: Так как коэффициент ранговой корреляции Спирмена близок к единице, то оценки поведения детей родителями и педагогом очень хорошо согласованы.
Обработка данного примера в среде SPSS:
[п3]
Дата добавления: 2014-11-06; Просмотров: 493; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |