Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Уравнения прямых регрессии для парной корреляции

Линейная корреляция.

Основные задачи теории корреляции

Функциональная, статистическая и корреляционная зависимости.

ЛЕКЦИЯ 12

Тема 11: Элементы теории корреляции

ПЛАН

1. Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции.

2. Линейная корреляция. Уравнения прямых регрессии для парной корреляции.

3. Оценка тесноты связи. Коэффициент корреляции (выборочный), его определение и свойства.

4. Коэффициент детерминации и корреляционное отношение.

5. Проверка значимости уравнения регрессии.

"correlatio" – соотношение, взаимосвязь английские статистики Ф.Гальтон К.Пирсон середина XIX века
"regressio" – движение назад

Функциональная зависимость – каждому значению одной переменной соответствует по некоторому правилу единственное значение другой переменной.

Статистическая зависимость – каждому значению одной переменной соответствует множество значений другой переменной. Точнее, каждому значению одной переменной соответствует распределение (условное) другой переменной (стохастическая или вероятностная зависимость).

Например, зависимость урожайности от количества внесенных удобрений.

Определение 1. Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Mx (Y)=j(x) или My (X)=y(y) – уравнения регрессии Y по X или X по Y, функции j(x) и y(y) – функции регрессии, а их графики – линии регрессии.

Для отыскания уравнений регрессии необходимо знать закон распределения двумерной случайной величины (X, Y). На практике, как правило, известна некоторая выборка пар значений (xi, yj). Поэтому ставят вопрос об оценке (приближенном выражении) функций регрессии, которую проводят методом наименьших квадратов.

Основные задачи теории корреляции:

– основной задачей регрессионного анализа является установление формы и изучение зависимости между случайными переменными;

– основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка тесноты связи.

Данные о статистической зависимости между двумя переменными величинами удобно задавать в виде корреляционной таблицы:

  y 1 y 2 yj ym Всего: или ni
x 1 n 11 n 12 n 1 j n 1 m n 1
x 2 n 21 n 22 n 2 j n 2 m n 2
xi n i1 n i2 nij nim ni
xl nl 1 nl 2 nlj nlm nl
Всего: или nj n 1 n 2 nj nm n

где: l – число интервалов по переменной X, m – число интервалов по переменной Y;

xi и yj – середины соответствующих интервалов;

nij – частоты пар (xi; yj);

, ;

– объем выборки.

Определение 1. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии j(x) и y(y) являются линейными.

Этот вид корреляционной зависимости встречается довольно часто. В этом случае обе линии регрессии являются прямыми и называются прямыми регрессии.

Выведем уравнение прямой регрессии Y по X, т.е. найдем коэффициенты линейной функции j(x)= + b.

Для этого применим метод наименьших квадратов, согласно которому неизвестные параметры a и b выбираются так, чтобы была минимальной сумма:

,

где групповые средние вычисляются по формулам:

.

Используя необходимое условие экстремума функции двух переменных, получаем систему нормальных уравнений для определения параметров линейной регрессии:

,

где соответствующие средние вычисляются по формулам:

, , , .

Решая систему нормальных уравнений, получаем:

, , где:

– выборочная дисперсия переменной X, выборочная ковариация.

Коэффициент a в уравнении регрессии называется выборочным коэффициентом регрессии Y по X и обозначается r yx. Итак,

Аналогично уравнение прямой регрессии X по Y имеет вид , где выборочный коэффициент регрессии X по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной Y на одну единицу. Здесь есть выборочная дисперсия переменной Y, где .

<== предыдущая лекция | следующая лекция ==>
Построение теоретического закона распределения по опытным данным. Понятие о критериях согласия | Его определение и свойства
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 876; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.041 сек.