КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Линейная регрессия
РЕГРЕССИОННЫЙ АНАЛИЗ При изучении корреляционной связи было отмечено, что коэффициент корреляции показывает степень связи, направление связи, форму связи между двумя исследуемыми выборками, но он не дает возможности определить, как количественно меняется одна величина по мере изменения другой. Регрессия - это зависимость среднего значения случайной величины У от величины Х и, наоборот, зависимость среднего значения случайной величины Х от величины У, описанная уравнением, полученная путем построения эмпирической или теоретической линии регрессии и с помощью вычисления коэффициентов регрессии. Существует линейная и нелинейная взаимосвязь между исследуемыми показателями, следовательно, можно составить уравнение линейной или нелинейной регрессии. Существует зависимость между двумя показателями и несколькими. И уравнения регрессии могут быть множественными. В выборе регрессионной модели помогает графическое представление экспериментальных данных в виде диаграммы рассеяния или корреляционного поля. По выборочным данным составляется корреляционное поле, на которое наносятся также средние значения У в каждом интервале изменения Х. Эти точки соединяются между собой ломаной линией, по виду которой можно судить, как в среднем меняется У в зависимости от изменения Х. Такая ломаная линия называется эмпирической линией регрессии. Затем ломаную линию аппроксимируют прямой линией. При линейной зависимости можно сделать проще: заменить корреляционный эллипс прямой линией.
Линейная регрессия, или линейная форма связи между случайными переменными занимает особое место в теории корреляции. При такой форме связи У есть линейная функция от Х, т. е. У = а + b×Х, где а и b – коэффициенты регрессии, Х – независимая случайная переменная. Линейная регрессия обусловливается двумерным нормальным законом распределения пары случайных величин (Х, У). Параметры в уравнении регрессии, т. е. коэффициенты регрессии, определяются по способу наименьших квадратов. Суть его заключается в том, чтобы сумма квадратов отклонений измеренных величин от истинного значения была бы минимальной. В случае линейной регрессии за теоретическое значение принимается значение У, получаемое по известной формуле, т. е. ищется такая прямая линия, сумма квадратов отклонений измеренных Уi от которой была бы минимальной. Значения коэффициентов регрессии определяются решением системы нормальных уравнений. Расчёт коэффициентов уравнений линейной регрессии
Как уже было сказано выше, в случае линейной зависимости уравнение регрессии является уравнением прямой линии. Различают У = ау/х +bу/х×Х - прямое уравнение регрессии; Х = ах/у+bх/у ×Y - обратное уравнение регрессии. Здесь а и b – коэффициенты, или параметры, которые определяются по формулам. Значение коэффициента b вычисляется
Из формул видно, что коэффициенты регрессии bу/х и bх/у имеют тот же знак, что и коэффициент корреляции, размерность, равную отношению размерностей изучаемых показателей Х и У, и связаны соотношением: Для вычисления коэффициента а достаточно подставить в уравнения регрессии средние значения коррелируемых переменных
График теоретических линий регрессии (рис. 17) имеет вид:
Рис 17. Теоретические линии регрессии
Из приведённых выше формул легко доказать, что угловые коэффициенты прямых регрессии равны соответственно
Так как , то . Это означает, что прямая регрессии Y на Х имеет меньший наклон к оси абсцисс, чем прямая регрессии Х на Y. Чем ближе к единице, тем меньше угол между прямыми регрессии. Эти прямые сливаются только тогда, когда . При прямые регрессии описываются уравнениями , . Таким образом, уравнения регрессии позволяют: · определить, насколько изменяется одна величина относительно другой; · прогнозировать результаты.
2. Методика выполнения расчётно-графической работы №2
Расчётно-графическая работа содержит 4 раздела.
В первом разделе: 3. Формулируется тема; 4. Формулируется цель работы.
Во втором разделе: 3. Формулируется условие задачи; 4. Заполняется таблица исходных данных выборки.
В третьем разделе: 4. Результаты измерений представляются в виде вариационного ряда; 5. Даётся графическое представление вариационного ряда. 6. Формулируется вывод.
В четвёртом разделе: 3. Рассчитываются основные статистические характеристики ряда измерений; 4. По итогам расчётов формулируется вывод.
Оформление работы: 3. Работа выполняется в отдельной тетради или на форматных листах. 4. Титульный лист заполняется по образцу.
Российский Государственный Университет физической культуры, спорта, молодёжи и туризма
Кафедра естественнонаучных дисциплин
Корреляционный и регрессионный анализы Расчётно-графическая работа №2 по курсу математики
Выполнил: студент 1 к. 1 пот. 1гр. Иванов С.М.
Преподаватель: доц. кафедры ЕНД и ИТ (Ф.И.О.) Москва – 2012
(Пример оформления титульного листа) Пример выполнения расчётно-графической работы №2.
Тема работы: Корреляционный и регрессионный анализы. Цель работы: Определить взаимосвязь показателей двух выборок.
Ход выполнения работы: 1. Придумать две выборки из своего вида спорта с одинаковым объемом n. 2. Нарисовать корреляционное поле, сделать предварительный вывод. 3. Рассчитать коэффициент корреляции Бравэ-Пирсона и сделать вывод. 4. Определить достоверность коэффициента корреляции и сделать окончательный вывод. 5. Рассчитать коэффициент детерминации и сделать вывод о степени взаимосвязи показателей двух выборок. 6. Рассчитать коэффициенты прямого и обратного уравнений регрессии. 7. Построить теоретические линии регрессии на корреляционном поле и показать точку их пересечения.
1. Условие задачи: У группы спортсменов определяли результаты в беге на 100 м с барьерами Xi (с) и прыжках в длину Yi (м) (табл.). Проверить, существует ли корреляционная связь между исследуемыми признаками и определить достоверность коэффициента корреляции.
Таблица исходных данных выборки: Результаты приведены в таблице исходных данных. Таблица 6 Результаты бега и прыжка
Решение: 2. Построим корреляционное поле (диаграмму рассеяния) и сделаем предварительный вывод относительно связи между исследуемыми признаками.
Рис 18. Корреляционное поле
Предварительный вывод: Связь между показателями результатов в беге на 100 м с барьерами Xi (с) и прыжками в длину Yi (см): · линейная; · отрицательная; · сильная. 3. Рассчитаем парный линейный коэффициент корреляции Бравэ – Пирсона, предварительно рассчитав основные статистические показатели двух выборок. Для их расчёта составим таблицу, в которой предпоследний и последний столбцы необходимы для расчёта стандартных отклонений, если они неизвестны. Для нашего примера эти значения рассчитаны в первой расчётно-графической работе, но для наглядности покажем расчёт дополнительно.
Таблица 7 Вспомогательная таблица для расчета коэффициента корреляции Бравэ – Пирсона
sx = ,
sy = ,
.
Полученное значение коэффициента корреляции позволяет подтвердить предварительный вывод и сделать окончательное заключение – связь между исследуемыми признаками: · линейная; · отрицательная; · сильная. 4. Определим достоверность коэффициента корреляции. Предположим, что связь между результатом в беге на 100 м и прыжком в длину отсутствует (Но: r= 0). · . · Находим = 2,12 для α = 0,05 и n = n - 2 = 16. · tрасчет > tтабл (19,6 > 2,12). Вывод: существует сильная, отрицательная статистически достоверная (р =0,95) связь между бегом с препятствиями на дистанцию 100 м и прыжком в длину. Это означает, что с улучшением результата в прыжке в длину уменьшается время пробега дистанции 100 м. 5. Вычислим коэффициент детерминации: . Следовательно, только 96% взаимосвязи результатов в беге на 100 м с барьерами и в прыжке в длину объясняется их взаимовлиянием, а остальная часть, т. е. 4% объясняется влиянием других неучтённых факторов.
6. Рассчитаем коэффициенты прямого и обратного уравнений регрессии, воспользовавшись формулами, подставим значения рассчитанных коэффициентов в соответствующую формулу и запишем прямое и обратное уравнения регрессии:
Y = а1 + b1×Х - прямое уравнение регрессии;
Х = а2 + b2 ×Y - обратное уравнение регрессии.
Воспользуемся результатами расчёта, приведёнными выше:
sx = ; sy = ; ; 13,59; 6,4,
Рассчитаем коэффициент b1, воспользовавшись формулой:
Для расчета коэффициента а1 подставим в прямое уравнение регрессии вместо b1 рассчитанное значение, а вместо Х и Y средние арифметические значения двух выборок из таблицы:
Подставим полученные значения коэффициентов а1 и b1 в прямое уравнение регрессии и запишем уравнение прямой линии:
Y = 22 - 1,15 ×Х
Рассчитаем коэффициент b2, воспользовавшись формулой:
Для расчета коэффициента а2 подставим в прямое уравнение регрессии вместо b2 рассчитанное значение, а вместо Х и Y средние арифметические значения двух выборок из таблицы:
Подставим полученные значения коэффициентов а1 и b1 в прямое уравнение регрессии и запишем уравнение прямой линии:
Х = 18,92 - 0,83 ×Y
Таким образом, мы получили прямое и обратное уравнения регрессии:
Y = 22 - 1,15 ×Х - прямое уравнение регрессии; Х = 18,92 - 0,83 ×Y - обратное уравнение регрессии.
Для проверки правильности расчётов достаточно подставить в прямое уравнение среднее значение и определить значение Y. Полученное значение Y должно быть близким или равным среднему значению . Y = 22 - 1,15 × = 22 - 1,15 × 13,59 = 6,4 = .
При подстановке в обратное уравнение регрессии среднего значения , полученное значение Х должно быть близким или равным среднему значению .
Х = 18,92 - 0,83 × = 18,92 - 0,83 × 6,4 = 13,6 = . 7. Построим линии регрессии на корреляционном поле. Для графического построения теоретических линий регрессии, как и для построения любой прямой, необходимо иметь две точки из диапазона значений Х и Y. Причём, в прямом уравнении регрессии независимая переменная Х, а зависимая Y, а в обратном – независимая переменная Y, а зависимая Х.
Y = 22 - 1,15 ×Х
Х = 18,92 - 0,83 ×Y
Координатами точки пересечения линий прямого и обратного уравнений регрессии являются значения средних арифметических двух выборок (с учётом погрешностей округлений при приближённых расчётах).
Вывод: зная результат бега с препятствиями на дистанцию 100 м, по прямому уравнению регрессии, можно теоретически определить результат прыжка в длину; и наоборот, зная результат прыжка в длину по обратному уравнению регрессии, можно определить результат бега с препятствиями.
ПРИЛОЖЕНИЕ
Дата добавления: 2015-07-02; Просмотров: 4316; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |