КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Корреляция и регрессия
Зависимость, при которой изменение одной случайной величины вызывает изменение распределения другой, называется статистической. При статистической зависимости различают корреляцию [2] для установления взаимосвязи между двумя или более случайными величинами с оценкой тесноты этой связи, и регрессию, при которой устанавливается форма (характер) зависимости между случайными величинами, чаще всего в виде полиномов. Оценка тесноты связи производится путем расчета коэффициента ковариации , равного для двух случайных величин х и y: (2.1) где и - средние значения величин х и y. Поскольку размерности х и y могут быть разные, то вычисляют коэффициент корреляции обычно в виде (2.2) где и - среднеквадратические отклонения Х и Y. Коэффициент корреляции (2.2) изменяется от -1 до +1. При корреляция положительна, при корреляция отсутствует, при говорят о наличии обратной корреляции между двумя случайными величинами. В общем случае, когда число значений и различно, коэффициент корреляции вычисляется по формуле: где - число значений, принимающих одновременно величины и , n – общее число и . В том случае, когда число случайных величин больше двух (N >2), корреляция оценивается либо по ковариационной матрице B, равной: (2.3) где - коэффициенты ковариации, причем , а по диагонали матрицы (2.3) расположены дисперсии случайных величин , либо по корреляционной матрице R, равной (2.4) где - коэффициенты корреляции, . Обе матрицы (2.3) и (2.4) симметричны относительно главной диагонали. Под регрессией понимают сглаживание экспериментальной зависимости по методу наименьших квадратов. Метод наименьших квадратов состоит в минимизации суммы квадратов отклонений сглаживающей прямой (кривой) от экспериментальной зависимости , т.е.
где может быть линейная , нелинейная или множественная регрессия. Метод наименьших квадратов приводит к системе нормальных уравнений для нахождения коэффициентов регрессии Эта система уравнений в матричной форме выражается следующим образом
(2.5)
где X - матрица значений исходных случайных величин ; - транспонированная к X матрица; А – матрица-столбец коэффициентов регрессии ; Y – матрица-столбец случайной величины Y, для которой устанавливается форма (вид) регрессии, обычно в виде полинома. На базе регрессионного анализа решаются две основные задачи: а) установление формы корреляционной связи, т.е. вида регрессии; б) оценка тесноты корреляционной связи. Ниже рассматриваются различные виды регрессий путем решения системы уравнений (2.5).
Дата добавления: 2015-06-26; Просмотров: 848; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |