КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Корреляционный и регрессионный анализы
ВВЕДЕНИЕ С О Д Е Р Ж А Н И Е Введение 4 1. Тема №1. Корреляционный и регрессионный анализы 4 2. Тема №2. Статистические характеристики количественной и качественной изменчивости 8 3. Тема №3. Статистические методы проверки нулевой гипотезы 13 4. Тема №4. Дисперсионный анализ однофакторного исследования 17 Приложение 23 Библиографический список 26 Варианты задач к темам №1, 2, 3, 4. 27 В настоящее время наблюдается все возрастающий интерес к использованию математической статистики представителями самых различных отраслей науки. Статистические методы находят широкое применение в планировании экспериментов и обследований в сельском хозяйстве, при оценке параметров и проверке гипотез, при принятии решений и изучении сложных систем. Знание современных статистических методов необходимо не только для обработки полученных в опыте данных, когда многое уже нельзя исправить, но и на всех этапах эксперимента – от планирования до обработки полученных величин. В каждом анализе большое значение придается последовательности ведения расчетов необходимых статистических характеристик. Т Е М А №1 В исследованиях редко приходится иметь дело с точными и определенными функциональными связями, когда каждому значению одной величины соответствует строго определенное значение другой величины. Здесь чаще встречаются такие соотношения между переменными, когда каждому значению признака Х соответствует не одно, а множество возможных значений признака Y, т.е. их распределение. Такие связи, обнаруживаемые лишь при массовом изучении признаков, в отличие от функциональных называются стохастическими (вероятностными) или корреляционными.
При изучении корреляционных связей возникают два основных вопроса – о тесноте связи и о форме связи. Для измерения тесноты и формы связи используют специальные статистические методы, называемые корреляцией и регрессией. Корреляция - это тенденция двух переменных к определенно выраженной зависимости между ними (например: изучить зависимость кислотности воды (X) от количества содержания кальция (Y) в родниковых водах Чарышского района). По форме корреляция может быть линейной или криволинейной, по направлению - прямой или обратной. Корреляцию и регрессию называют простой, если исследуется связь между двумя признаками, и множественной, когда изучается зависимость между тремя и более признаками. Числовым показателем простой линейной корреляции является коэффициент корреляции r, указывающий на тесноту и направление взаимосвязи между изучаемыми признаками X и У. Он является безразмерной величиной и изменяется в пределах от -1 до + 1. Если r < 0,3, то линейная зависимость между признаками слабая или отсутствует (но криволинейная связь может существовать), при значениях r = 0,3 - 0,7 взаимосвязь признается средней по тесноте, а при r>0,7 между признаками существует тесная линейная зависимость. Если коэффициент корреляции положительный, то зависимость между признаками прямая, если r со знаком минус, связь обратная. Коэффициент корреляции рассчитывают по формуле: где: r – коэффициент корреляции; X и Y - изучаемые признаки; и среднее значение X и Y. Коэффициент детерминации dxy показывает долю тех изменений, которые зависят от изучаемого фактора и рассчитывается по формуле: dxy = r2×100%
Для оценки надежности выборочного коэффициента корреляции вычисляют его ошибку где: r2 – коэффициент корреляции в квадрате, n – общее число степеней свободы (число показателей X). По вычисленным значениям r и Sr определяют критерий существенности коэффициента корреляции:
где: tф –фактическое значение критерия сущности (фактический критерий Стъюдента); r – коэффициент корреляции; Sr – ошибка коэффициента корреляции.
Фактическое значение tr сравнивается с теоретическим значением (tтеор), который находится по таблице Стьюдента при уровне вероятности 95% (приложение 1). Число степеней свободы принимается n-2. При tr> tтеор корреляционная связь существенна, при tr< tтеор – несущественна. Если корреляция указывает факт наличия линейной связи и степень ее близости, то регрессия определяет форму этой взаимосвязи. Для этого определяют коэффициент регрессии Bух, который показывает, в каком направлении и на какую величину изменяется функция У при изменении аргумента X на единицу измерения. Коэффициент регрессии рассчитывается по формулам: или Под регрессией понимается изменение результативного признака Y (функции) при определенном изменении одного или нескольких факториальных (аргументов). Ошибка коэффициента регрессии рассчитывается по формуле: Критерий существенности регрессии: Методика решения задачи на тему: «Корреляции и регрессия» Пример: Провести корреляционный и регрессионный анализ гидравлических элементов потока и расходы наносов при гладкой форме их движения (расход воды (л/с) (X)) и (глубина воды в лотке осредненная по длине потока - h (см) (Y)). (Люберецкий песрк) Для вычислений составляется таблица вспомогательных величин: Таблица Таблица вспомогательных величин
Среднее число кислотности воды = ∑ X: n = 596: 10 = 39459,6 (л/с)
Среднее число содержания кальция = ∑ Y: n = 151,7: 10 = 15,2 (см) где: n – число сопряженных пар. Используя данные вспомогательной таблицы, рассчитывают коэффициент корреляции: Стандартная ошибка коэффициента корреляции: Коэффициент детерминации: dxy = r2×100% = 0,962 ×100% = 92,16% Фактическое значение критерия существенности определяют по формуле: Теоретическое значение t05 для (n-2) степеней свободы берут из таблицы (приложение 1): t05 = 2,31. Если tr≥ tтеор, корреляционная связь признается существенной и необходимо определить коэффициент регрессии: Ошибка коэффициента регрессии: Критерий существенности регрессии: На основании полученных данных находим уравнение линейной регрессии: По уравнению регрессии можно рассчитать средние теоретические значения Y для экстремальных (минимального и максимального) значения X и построить теоретическую линию регрессии (рис.1).
Для Xmin = 11(л/с); Ymin = 0,18 × 6,5 + 15,2 = 16,37 (см) Для Xmax = 86,0 (л/с); Ymax = 0,18 × 21,5 + 15,2 = 19,07 (см)
Рисунок 1 - Теоретическая линия регрессии зависимости расхода воды (X) от глубины воды в лотке (Y).
Вывод: 1. Между расходом воды и ее глубиной в лотке в существует сильная по тесноте и прямая по направлению взаимосвязь (r = 0,96). 2. В 92,16% случаев (из 100) расход воды обусловен и зависит от глубины воды в лотке, а в 7,84% случаев от других факторов (dxy = 92,16%). Т Е М А №2
Дата добавления: 2015-08-31; Просмотров: 1056; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |