Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Регрессионный анализ

Коэффициент корреляции указывает на степень тесноты взаимосвязи между двумя признаками, но он не дает ответа на вопрос, как изменение одного признака на одну единицу его размерности влияет на изменение другого признака. Для того чтобы ответить на этот вопрос, пользуются методами регрессионного анализа.

Регрессионный анализ устанавливает форму зависимости между случайной величиной и значениями переменной величины , причем, значения считаются точно заданными.

Уравнение регрессии – это формула статистической связи между переменными.

Если эта формула линейна, то речь идет о линейной регрессии. Формула статистической связи двух переменных называется парной регрессией (нескольких переменных – множественной)

Если корреляционное поле двух признаков имеет форму, близкую к эллипсу, как на рис. 1,в) и г), то зависимости от и от описываются уравнениями регрессии:

,

где коэффициенты и - коэффициенты регрессии, и - свободные члены уравнения.

Значения неизвестных параметров определяются методом наименьших квадратов из системы:

где - коэффициент корреляции между рассматриваемыми признаками; и - средние квадратические отклонения значений тех же признаков, - средние значения переменных.

Коэффициент регрессии - это величина, показывающая, на сколько единиц размерности изменится величина при изменении величины на одну единицу ее размерности. Аналогично определяется коэффициент .

Как и коэффициент корреляции, коэффициент вариации может принимать и положительные и отрицательные значения. Например, если коэффициент имеет знак "-", то это означает, что при увеличении значения признака на единицу его размерности значение признака уменьшается на величину, равную .

Уравнения линейной регрессии являются уравнениями прямых линий в плоскости (рис. 3), проходящих внутри соответствующего корреляционного поля. Такие линии называются линиями регрессии.

 

 

 
 

Пример 4. По условиям примера 1 определить, как изменяется в среднем масса пловца, если рост увеличится в среднем на 1 см, и построить соответствующую линию регрессии.

Решение. Пользуясь результатами, полученными в примере 1, вычислим коэффициент регрессии:

.

Вывод: если абсолютная поверхность тела увеличится на , то его масса увеличится на 42,74 кг.

Найдем коэффициент для уравнения регрессии:

.

Тогда искомое уравнение примет вид:

.

По этому уравнению строим прямую линию на корреляционном поле (рис.4). Для построения прямой достаточно взять две точки, соответствующие крайним значениям признака :

 


Замечание. По тем же данным можно ответить на другой вопрос: как изменится площадь поверхности тела, если масса спортсмена увеличится на 1 кг? Для этого необходимо вычислить коэффициент регрессии:

.

Это означает следующее: когда вес спортсмена увеличится на 1 кг, абсолютная поверхность тела увеличится на .

 

Пример 6. Девушки 9-го класса показали результаты в сгибании и разгибании рук в упоре лежа (, раз) и в подтягивании на низкой перекладине из виса лежа (, раз), приведенные в табл.

Требуется:

ü определить тесноту взаимосвязи между данными признаками;

ü составить уравнение регрессии;

ü найти предполагаемый средний результат в подтягивании, если в отжимании показаны результаты: а) 25 раз; б) 6 раз.

, раз                              
, раз                              

 

Решение.

 
 

1. Строим корреляционное поле.

По рисунку видно, что связь между признаками линейная и положительная, так как корреляционное поле представляет собой вытянутый эллипс.

 

2. Вычисляем тесноту взаимосвязи по коэффициенту корреляции.

В ходе вычислений постепенно заполняем таблицу.

 

 

               
               
      -5 -4      
               
      -5 -3      
      -4   -4    
      -4 -1      
        -1      
        -1      
      -2   -2    
      -2 -3      
               
      -4 -5      
        -2      
               
S              

Вычисляем средние арифметические значения обоих признаков:

, .

Находим произведения и суммируем их (последняя строка в 6-м столбце).

Вычисляем , и суммируем их (последняя строка в 7-м и 8-м столбцах).

Находим средние квадратические отклонения:

, .

Подставляя в формулу вычисленные характеристики, находим коэффициент линейной корреляции : .

3. Проверим достоверность (значимость) полученного коэффициента корреляции.

Для этого вычислим расчетное значение критерия Стьюдента:

.

Задаемся уровнем значимости: . По формуле находим число степеней свободы:

.

Из таблицы критических значений распределения Стьюдента следует:

.

Т.к. , следовательно, коэффициент корреляции значим с вероятностью . Выявлена сильная положительная статистическая взаимосвязь. Это означает, что улучшение результатов в подтягивании связано с улучшением результатов в сгибании и разгибании рук в упоре лежа.

4. Для составления уравнения регрессии находим коэффициенты и :

; .

Тогда уравнение регрессии принимает вид: .

5. Строим линии регрессии на корреляционном поле. Для этого берем две точки, соответствующие крайним значениям признака (можно взять любые другие две точки, удобные для вычислений):

По данным точкам проводим линию регрессии.

 
 

Построенная прямая близка к точкам наблюдений, следовательно, найденное уравнение регрессии имеет хорошее качество и может быть использовано для прогнозирования.

6. Спрогнозируем результат в подтягивании, если результат в отжимании составит а):

.

Так как результат в подтягивании должен быть целым числом, то принимаем: .

При б)имеем:

.

Принимаем .

<== предыдущая лекция | следующая лекция ==>
Оценка достоверности коэффициента корреляции | 
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 192; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.