Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Уравнения регрессии. Корреляция и коэффициент корреляции В начало пункта Оглавление

Корреляция и коэффициент корреляции

В начало пункта Оглавление

Ситуация, когда одно явление похоже на другое (или, наоборот, наблюдения обратно зависимы) или одно явление оказывает заметное влияние на другое называют корреляцией. Таким образом, если две кривые коррелируют между собой, то на глаз можно отметить совпадение по времени отдельных локальных максимумов или минимумов. Мы, таким образом, получим качественное представление о корреляции. Количественную характеристику дает коэффициент корреляции, который может принимать любые значения от -1 до +1. Если между величинами Х и Y существует точная детерминированная, линейная зависимость, то коэффициент корреляции равен 1 или -1, а при отсутствии корреляции (Х и Y независимы) - нулю.

По промежуточному значению коэффициента корреляции можно судить о степени связи величин между собой. Пусть

,.

Возьмем эту точку в качестве начала координат новой системы,. Мы получим точки на плоскости, рассеянные около начала координат. Если при x>0 наблюдается, как правило, y>0, а при x<0 - y<0, то говорят, что корреляция положительная. В противном случае - отрицательная.

Возьмем сумму произведений. При положительной корреляции почти все члены этой суммы положительны, практически никакой компенсации не происходит. Однако, величина этой суммы зависит как от числа членов, так и от масштабов, в которых измеряются величины x и y, а не только от корреляции. Чтобы исключить влияние числа членов суммы и масштабов, в качестве эмпирического коэффициента корреляции берут

,

где

Если n - невелико, то может быть отличным от нуля даже и в том случае, когда Xk и Yk не коррелируют. Просто случайным образом точки расположили на плоскости так, что оказалось отличным от нуля. Поэтому помимо вычисления эмпирического коэффициента корреляции необходимо определить и его среднеквадратическую погрешность

Рассмотрим частный случай. Пусть Х и Y связаны между собой строгой линейной зависимостью.

Тогда все наблюдения (Xk, Yk) подчиняются этой зависимости,, т.е. yk=axk

Очевидно, что.

Следовательно,.

В реальных ситуациях лежит между этими двумя пределами.

В начало пункта Оглавление

Аппроксимация данных с учетом их статистических параметров относится к задачам регрессии. Они обычно возникают при обработке экспериментальных данных, полученных в результате измерений процессов или физических явлений, статистических по своей природе (как, например, измерения в радиометрии и ядерной геофизике), или на высоком уровне помех (шумов). Задачей регрессионного анализа является подбор математических формул, наилучшим образом описывающих экспериментальные данные.

Математическая постановка задачи регрессии заключается в следующем. Зависимость величины (числового значения) определенного свойства случайного процесса или физического явления Y от другого переменного свойства или параметра Х, которое в общем случае также может относиться к случайной величине, зарегистрирована на множестве точек множеством значений при этом в каждой точке зарегистрированные значения Yk и Xk отображают действительные значения Yk(Xk) со случайной погрешностью, распределенной, как правило, по нормальному закону. По совокупности значений Yk требуется подобрать функцию для которой зависимость Y(X) отображалась бы с минимальной погрешностью.

Функцию называют регрессией величины y на величину х. Регрессионный анализ предусматривает задание вида функции и определение численных значений ее параметров a0, a1, …, an, обеспечивающих наименьшую погрешность приближения к множеству значений Yk. Как правило, при регрессионном анализе погрешность приближения вычисляется методом наименьших квадратов (МНК).

Виды регрессии обычно называются по типу аппроксимирующих функций: полиномиальная, экспоненциальная, логарифмическая и т.п.

<== предыдущая лекция | следующая лекция ==>
Детерминированные и статистические зависимости | Линейная регрессия
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 304; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.