КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Коэффициент корреляции Пирсона
Тема 7 Исследователей часто интересует, как связаны между собой две переменные в данной группе лиц (классы, школы, нации и т.д.). Например, имеют ли ученики, научившиеся читать раньше других, тенденцию к более высокой успеваемости в шестом классе? Наблюдаются ли в больших классах мéньшие успехи в приобретении знаний за семестр, чем в небольших классах? Связана ли средняя продолжительность работы педагогов в школе непосредственно со средней заработной платой? Очевидно, для ответа на такие вопросы мы должны провести наблюдения по каждой переменной для группы объектов (типичных представителей, которыми могут быть классы, школы, районы и т.д.). Данные, собранные для ответа на один из подобных вопросов, могут выглядеть, как в приведенной ниже таблице 7.1.
Таблица 7.1
В этом примере переменными, которые изучались у 12 школьников, были оценки IQ, определённые с помощью Шкалы интеллекта Стенфорда – Бине в шестом классе, и успеваемость по химии в средней школе, оцененная на основе теста, состоящего из 35 вопросов. Связь между двумя переменными можно выразить графически диаграммой рассеивания. Диаграмма рассеивания для данных примера показана на рисунке 7.1. На диаграмме рассеивания каждый ученик изображается точкой. Точка, или метка, располагается в месте пересечения прямых линий, проведенных через оценку IQ перпендикулярно оси Х и через оценку теста по химии перпендикулярно оси Y для каждого ученика. Диаграмма на рисунке 7.1 показывает слабую положительную связь Х и Y. Однако мы пока не имеем обобщенной меры этой связи. Надо поставить общий вопрос о более точном смысле термина «связь». Существует ли соответствие большого значения Х большим или малым значениям тех же объектов по Y или систематического распределения по парам с большими и малыми значениями не наблюдается? Положение объекта относительно остальных в выборке по Х и Y, определяемое средними двух распределений, проявляется в величинах и знаках отклонений
Рис. 7.1 – Диаграмма рассеивания, показывающая связь IQ (Х) с успеваемостью по химии (Y) для 12 школьников
Если Х и Y в основном связаны прямо (большие значения с большими, а малые – с малыми), то большинство произведений Если Х и Y имеют обратную связь (большое Х встречается с малым Y и наоборот), то многие объекты с положительными значениями
будет отрицательной, когда Х и Y связаны обратной зависимостью. Если Х и Y не имеют систематической связи (большие Х сочетаются с малыми Y столь же часто, как и с большими Y, и то же самое справедливо для малых Х), то среди объектов с большими положительными значениями
должна приблизительно балансировать положительные и отрицательные члены и поэтому должна быть довольно близкой к нулю. Таким образом, мы имеем величину
Величина
Заметим, что ковариация Х с самим собой – это просто дисперсия Х:
Ковариация является вполне удовлетворительной мерой связи во многих задачах физики и техники. (Действительно, физики называют пресловутый бихевиористский «коэффициент корреляции», который часто встречается в зарубежных дидактических и психологических исследованиях, «безразмерной ковариацией»). И она представляет собой адекватную меру в той же степени, в какой шкала (среднее и дисперсия) переменных не является произвольной и имеет некоторый смысл. Многие переменные, с которыми мы имеем дело, измеряются в произвольных шкалах: среднее и дисперсию можно сделать любыми, какими вздумается, поскольку нас обычно интересует только взаимоположение объектов в группе. Это, в частности, верно для обработки психологических и педагогических данных. Вычитание значений Х и Y из соответствующих средних сделало
Обозначение r происходит от слова регрессия. На первоначальном этапе применения этого коэффициента Фрэнсисом Гальтоном и Карлом Пирсоном (1857–1936) он играл важную роль в исследовании связей физических характеристик людей, исследовании, которое вначале было направлено на изучение регрессии физических изменений от одного поколения к другому. Формула для вычисления Уравнение (7.2) определяет
Заметьте, что 1 / (n – 1) можно выделить в качестве сомножителя из двух членов знаменателя уравнения (7.3) (
Простые преобразования приводят к следующей формуле для
которую можно ещё более упростить, образуя расчётную формулу
Пример вычисления Для иллюстрации вычисления Таблица 7.2 Исходные оценки по тесту, состоящему из 50 вопросов и измеряющему способность к абстрактному и вербальному мышлению у 40 школьников неполной средней школы в Иллинойсе
Таблица 7.3 Пример вычисления
Окончательные вычисления в правой части табл. 7.3 приводят к
Рис. 7.2 – Диаграмма рассеивания 40 пар результатов теста из табл. 7.2 Область изменения Хотя это и затруднительно доказать, но Таблица 7.4 Интерпретация значений
В таблице 7.4 перечислены различные значения
Дата добавления: 2014-10-22; Просмотров: 911; Нарушение авторских прав?; Мы поможем в написании вашей работы! |