Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Оценка достоверности коэффициента корреляции

Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.

Результат на 100м (х,с) 10,7 10,6 10,7 10,5 10,9 10,4 10,3 10,7 10,7
Место в тр.прыжке (у)                  

 

Решение. При решении этой задачи лучше все вычисления постепенно заносить в таблицу.

1. Результаты в беге ранжируем, то есть располагаем их в порядке возрастания:

10,3; 10,4; 10,5; 10,6; 10,7; 10,7; 10,7; 10,7; 10,9.

Для тех результатов, которые повторяются несколько раз, ранг берем как среднее рангов этих результатов. Результат 10,7 повторяется четыре раза, занимая в ряду ранги 5, 6, 7, 8. Тогда

.

  10,7   6,5   1,5 2,25
  10,6   4,0   2,0 4,00
  10,7   6,5   0,5 0,25
  10,5   3,0   -1,0 1,00
  10,9   9,0   6,0 36,00
  10,4   2,0   -5,0 25,00
  10,3   1,0   -8,0 64,00
  10,7   6,5   -1,5 2,25
  10,7   6,5   5,5 30,25
S            

Для ранг - это занятое место, поэтому , и 5-й столбец таблицы повторяет 3-й столбец.

2. Находим разность рангов: (предпоследний столбец).

3. Разность рангов возводим в квадрат и суммируем: .

4. Находим: .

5. Вывод: между исследуемыми признаками существует средне-выраженная отрицательная зависимость, показывающая, что при уменьшении признака (времени бега на 100 м) результат прыжка в длину увеличивается.

 

Полученные в примерах коэффициенты корреляции являются выборочными, так как они определены для выборок из соответствующих генеральных совокупностей. Поэтому всегда существует ошибка коэффициента корреляции. Эта ошибка - расхождение между коэффициентом корреляции выборки объемом и коэффициентом корреляции для генеральной совокупности - определяется формулами:

при ; и при .

Оценка достоверности коэффициента линейной корреляции осуществляется с помощью -критерия Стьюдента:

.

В данном случае критерий служит для проверки нулевой гипотезы о том, что значение коэффициента корреляции для генеральной совокупности равно нулю, т.е. в генеральной совокупности отсутствует корреляция. Альтернативной является гипотеза .

Критическое значение определяется по таблице Стьюдента. Число степеней свободы связано с объемом выборки формулой:

.

Если , то нуль-гипотеза отвергается, то есть вычисленный коэффициент корреляции значимо отличается от нуля с вероятностью .

 

Пример 3. Коэффициент корреляции между показателями "Толчок штанги" и "Прыжок в высоту с места" для 13 тяжелоатлетов равен 0,855. Требуется оценить достоверность коэффициента корреляции.

Решение. Так как , то для вычисления расчетное значение критерия Стьюдента пользуемся формулой:

.

Задаемся уровнем значимости коэффициента корреляции (вероятность ошибки): . По формуле находим число степеней свободы:

.

Из таблицы критических значений распределения Стьюдента следует:

.

То есть (5,48>4,437). Следовательно, связь между показателями, выраженная коэффициентом корреляции, статистически значима с вероятностью 0,999.

4.3. Регрессионный анализ

Коэффициент корреляции указывает на степень тесноты взаимосвязи между двумя признаками, но он не дает ответа на вопрос, как изменение одного признака на одну единицу его размерности влияет на изменение другого признака. Для того чтобы ответить на этот вопрос, пользуются методами регрессионного анализа.

Регрессионный анализ устанавливает форму зависимости между случайной величиной и значениями переменной величины , причем, значения считаются точно заданными.

Уравнение регрессии – это формула статистической связи между переменными.

Если эта формула линейна, то речь идет о линейной регрессии. Формула статистической связи двух переменных называется парной регрессией (нескольких переменных – множественной)

Если корреляционное поле двух признаков имеет форму, близкую к эллипсу, как на рис. 1,в) и г), то зависимости от и от описываются уравнениями регрессии:

,

где коэффициенты и - коэффициенты регрессии, и - свободные члены уравнения.

Значения неизвестных параметров определяются методом наименьших квадратов из системы:

где - коэффициент корреляции между рассматриваемыми признаками; и - средние квадратические отклонения значений тех же признаков, - средние значения переменных.

Коэффициент регрессии - это величина, показывающая, на сколько единиц размерности изменится величина при изменении величины на одну единицу ее размерности. Аналогично определяется коэффициент .

Как и коэффициент корреляции, коэффициент вариации может принимать и положительные и отрицательные значения. Например, если коэффициент имеет знак "-", то это означает, что при увеличении значения признака на единицу его размерности значение признака уменьшается на величину, равную .

Уравнения линейной регрессии являются уравнениями прямых линий в плоскости (рис. 3), проходящих внутри соответствующего корреляционного поля. Такие линии называются линиями регрессии.

 

 

 
 

Пример 4. По условиям примера 1 определить, как изменяется в среднем масса пловца, если рост увеличится в среднем на 1 см, и построить соответствующую линию регрессии.

Решение. Пользуясь результатами, полученными в примере 1, вычислим коэффициент регрессии:

.

Вывод: если абсолютная поверхность тела увеличится на , то его масса увеличится на 42,74 кг.

Найдем коэффициент для уравнения регрессии:

.

Тогда искомое уравнение примет вид:

.

По этому уравнению строим прямую линию на корреляционном поле (рис.4). Для построения прямой достаточно взять две точки, соответствующие крайним значениям признака :

 


Замечание. По тем же данным можно ответить на другой вопрос: как изменится площадь поверхности тела, если масса спортсмена увеличится на 1 кг? Для этого необходимо вычислить коэффициент регрессии:

.

Это означает следующее: когда вес спортсмена увеличится на 1 кг, абсолютная поверхность тела увеличится на .

 

Пример 6. Девушки 9-го класса показали результаты в сгибании и разгибании рук в упоре лежа (, раз) и в подтягивании на низкой перекладине из виса лежа (, раз), приведенные в табл.

Требуется:

ü определить тесноту взаимосвязи между данными признаками;

ü составить уравнение регрессии;

ü найти предполагаемый средний результат в подтягивании, если в отжимании показаны результаты: а) 25 раз; б) 6 раз.

, раз                              
, раз                              

 

Решение.

 
 

1. Строим корреляционное поле.

По рисунку видно, что связь между признаками линейная и положительная, так как корреляционное поле представляет собой вытянутый эллипс.

 

2. Вычисляем тесноту взаимосвязи по коэффициенту корреляции.

В ходе вычислений постепенно заполняем таблицу.

 

 

               
               
      -5 -4      
               
      -5 -3      
      -4   -4    
      -4 -1      
        -1      
        -1      
      -2   -2    
      -2 -3      
               
      -4 -5      
        -2      
               
S              

Вычисляем средние арифметические значения обоих признаков:

, .

Находим произведения и суммируем их (последняя строка в 6-м столбце).

Вычисляем , и суммируем их (последняя строка в 7-м и 8-м столбцах).

Находим средние квадратические отклонения:

, .

Подставляя в формулу вычисленные характеристики, находим коэффициент линейной корреляции : .

3. Проверим достоверность (значимость) полученного коэффициента корреляции.

Для этого вычислим расчетное значение критерия Стьюдента:

.

Задаемся уровнем значимости: . По формуле находим число степеней свободы:

.

Из таблицы критических значений распределения Стьюдента следует:

.

Т.к. , следовательно, коэффициент корреляции значим с вероятностью . Выявлена сильная положительная статистическая взаимосвязь. Это означает, что улучшение результатов в подтягивании связано с улучшением результатов в сгибании и разгибании рук в упоре лежа.

4. Для составления уравнения регрессии находим коэффициенты и :

; .

Тогда уравнение регрессии принимает вид: .

5. Строим линии регрессии на корреляционном поле. Для этого берем две точки, соответствующие крайним значениям признака (можно взять любые другие две точки, удобные для вычислений):

По данным точкам проводим линию регрессии.

 
 

Построенная прямая близка к точкам наблюдений, следовательно, найденное уравнение регрессии имеет хорошее качество и может быть использовано для прогнозирования.

6. Спрогнозируем результат в подтягивании, если результат в отжимании составит а):

.

Так как результат в подтягивании должен быть целым числом, то принимаем: .

При б)имеем:

.

Принимаем .

<== предыдущая лекция | следующая лекция ==>
 | Функция двух переменных
Поделиться с друзьями:


Дата добавления: 2013-12-12; Просмотров: 4457; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.062 сек.