Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляционный и регрессионный анализы




ВВЕДЕНИЕ

С О Д Е Р Ж А Н И Е

Введение 4

1. Тема №1. Корреляционный и регрессионный анализы 4

2. Тема №2. Статистические характеристики количественной и качественной изменчивости 8

3. Тема №3. Статистические методы проверки нулевой гипотезы 13

4. Тема №4. Дисперсионный анализ однофакторного исследования 17

Приложение 23

Библиографический список 26

Варианты задач к темам №1, 2, 3, 4. 27

В настоящее время наблюдается все возрастающий интерес к использованию математической статистики представителями самых различных отраслей науки. Статистические методы находят широкое применение в планировании экспериментов и обследований в сельском хозяйстве, при оценке параметров и проверке гипотез, при принятии решений и изучении сложных систем.

Знание современных статистических методов необходимо не только для обработки полученных в опыте данных, когда многое уже нельзя исправить, но и на всех этапах эксперимента – от планирования до обработки полученных величин.

В каждом анализе большое значение придается последовательности ведения расчетов необходимых статистических характеристик.

Т Е М А №1

В исследованиях редко приходится иметь дело с точными и определенными функциональными связями, когда каждому значению одной величины соответствует строго определенное значение другой величины. Здесь чаще встречаются такие соотношения между переменными, когда каждому значению признака Х соответствует не одно, а множество возможных значений признака Y, т.е. их распределение. Такие связи, обнаруживаемые лишь при массовом изучении признаков, в отличие от функциональных называются стохастическими (вероятностными) или корреляционными.

При изучении корреляционных связей возникают два основных вопроса – о тесноте связи и о форме связи. Для измерения тесноты и формы связи используют специальные статистические методы, называемые корреляцией и регрессией.

Корреляция - это тенденция двух переменных к определенно вы­раженной зависимости между ними (например: изучить зависимость кислотности воды (X) от количества содержания кальция (Y) в родниковых водах Чарышского района).

По форме корреляция может быть линейной или криволинейной, по направлению - прямой или обратной. Корреляцию и регрессию называют простой, если исследуется связь между двумя признаками, и множественной, когда изучается зависимость между тремя и более признаками. Числовым показателем простой линейной корреляции яв­ляется коэффициент корреляции r, указывающий на тесноту и на­правление взаимосвязи между изучаемыми признаками X и У. Он является безразмерной величиной и изменяется в пределах от -1 до + 1. Если r < 0,3, то линейная зависимость между признаками сла­бая или отсутствует (но криволинейная связь может существовать), при значениях r = 0,3 - 0,7 взаимосвязь признается средней по тес­ноте, а при r>0,7 между признаками существует тесная линейная зависимость. Если коэффициент корреляции положительный, то зависимость между признаками прямая, если r со знаком минус, связь обратная. Коэффициент корреляции рассчитывают по формуле:

где: r – коэффициент корреляции; X и Y - изучаемые признаки; и среднее значение X и Y.

Коэффициент детерминации dxy показывает долю тех измене­ний, которые зависят от изучаемого фактора и рассчитывается по формуле:

dxy = r2×100%

 

 

Для оценки надежности выборочного коэффициента корреляции

вычисляют его ошибку

где: r2 – коэффициент корреляции в квадрате, n – общее число степеней свободы (число показателей X).

По вычисленным значениям r и Sr определяют критерий существенности коэффициента корреляции:

где: tф –фактическое значение критерия сущности (фактический критерий Стъюдента); r – коэффициент корреляции; Sr – ошибка коэффициента корреляции.

 

Фактическое значение tr сравнивается с теоретическим значением (tтеор), который находится по таблице Стьюдента при уровне вероятности 95% (приложение 1). Число степеней свободы принимается n-2. При tr> tтеор корреляционная связь существенна, при tr< tтеор – несущественна.

Если корреляция указывает факт наличия линейной связи и сте­пень ее близости, то регрессия определяет форму этой взаимосвязи. Для этого определяют коэффициент регрессии Bух, который показы­вает, в каком направлении и на какую величину изменяется функция У при изменении аргумента X на единицу измерения. Коэффициент регрессии рассчитывается по формулам:

или

Под регрессией понимается изменение результативного признака Y (функции) при определенном изменении одного или нескольких факториальных (аргументов).

Ошибка коэффициента регрессии рассчитывается по формуле:

Критерий существенности регрессии:

Методика решения задачи

на тему: «Корреляции и регрессия»

Пример: Провести корреляционный и регрессионный анализ гидравлических элементов потока и расходы наносов при гладкой форме их движения (расход воды (л/с) (X)) и (глубина воды в лотке осредненная по длине потока - h (см) (Y)). (Люберецкий песрк)

Для вычислений составляется таблица вспомогательных величин:

Таблица

Таблица вспомогательных величин

N/N Значение признаков Отклонение Квадраты отклонений Произведение отклонений  
 
X Y  
  11,0 6,5 -48,6 -8,7 2361,96 75,69 422,82  
  28,0 9,0 -31,6 -6,2 998,56 38,44 195,92  
  46,0 12,6 -13,6 -2,6 184,96 6,76 35,36  
  48,0 14,0 -11,6 -1,2 134,56 1,44 13,92  
  65,0 13,5 5,4 -1,7 29,16 2,89 -9,18  
  71,5 18,5 11,9 3,3 141,61 10,89 39,27  
  77,5 17,8 17,9 2,6 320,41 6,76 46,54  
  80,0 19,8 20,4 4,6 416,16 21,16 93,84  
  83,0 21,5 23,4 6,3 547,56 39,69 147,42  
  86,0 18,5 26,4 3,3 696,96 10,89 87,12  
Сумма ∑   151,7 5831,9 214,61 1073,03  
Среднее значение и   59,6   15,2   -   -   -   -   -    
                   

Среднее число кислотности воды = ∑ X: n = 596: 10 = 39459,6 (л/с)

Среднее число содержания кальция = ∑ Y: n = 151,7: 10 = 15,2 (см)

где: n – число сопряженных пар. Используя данные вспомогательной таблицы, рассчитывают коэффициент корреляции:

Стандартная ошибка коэффициента корреляции:

Коэффициент детерминации: dxy = r2×100% = 0,962 ×100% = 92,16%

Фактическое значение критерия существенности определяют по формуле:

Теоретическое значение t05 для (n-2) степеней свободы берут из таблицы (приложение 1): t05 = 2,31.

Если tr≥ tтеор, корреляционная связь признается существенной и необходимо определить коэффициент регрессии:

Ошибка коэффициента регрессии:

Критерий существенности регрессии:

На основании полученных данных находим уравнение линейной регрессии:

По уравнению регрессии можно рассчитать средние теоретические значения Y для экстремальных (минимального и максимального) значения X и построить теоретическую линию регрессии (рис.1).

 

Для Xmin = 11(л/с); Ymin = 0,18 × 6,5 + 15,2 = 16,37 (см)

Для Xmax = 86,0 (л/с); Ymax = 0,18 × 21,5 + 15,2 = 19,07 (см)

 

Рисунок 1 - Теоретическая линия регрессии зависимости расхода воды (X) от глубины воды в лотке (Y).

 

Вывод: 1. Между расходом воды и ее глубиной в лотке в существует сильная по тесноте и прямая по направлению взаимосвязь (r = 0,96).

2. В 92,16% случаев (из 100) расход воды обусловен и зависит от глубины воды в лотке, а в 7,84% случаев от других факторов (dxy = 92,16%).

Т Е М А №2




Поделиться с друзьями:


Дата добавления: 2015-08-31; Просмотров: 1056; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.032 сек.