Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляционный момент и коэффициент корреляции




Вопрос 26

Рассмотрим вопрос о статистической зависимости случайных ве­личин.

Любые две случайные величины, входящие в систему, являются не­зависимыми или зависимыми. Поскольку степень взаим­ной зависимости может быть различной, целесообразно ввести количественную меру взаимной зависимости. В ка­честве такой меры могут служить корреляционный мо­мент и коэффициент корреляции (связи), к определению которых мы и перейдем.

Рассмотрим две дискретные случайные величины: Х и У. Пусть их возможные значения соответственно равны:

х1, х2,х3,… хi, …xs

y1, y2, y3,…yj,… yr

 

Среднее значение первой величины составляет х и второй - у. Введем в рассмотрение отклонения воз­можных значений случайных величин от их средних зна­чений, которые будем

 
 

коротко обозначать следующим образом:

В свое время (см. §6 гл. 3) говорилось, что среди отклонений имеются числа как положительные, так и отрицательные. Вероятности отклонений равны вероятностям

соответствующих значений случайных величин, т. е.

o o

P(xi -x) =P(хi)=P(хi) и Р(уj - у) =Р(уj)=Р(уi)

Если средние значения у случайных величин X или Y равны нулю, то их отклонения xi и yj равны соответствующим значениям случайных величин.

Положим далее, что известны условные и безусловные законы распределения случайных величин Х и Y и закон распределения системы этих дискретных величин Р(xi,yj).

Перемножим все возможные отклонения одной случайной величины xi почленно на все возможные отклонения друтой yj с учетом их вероятностей и все произведения сложим. В итоге получим величину, которая в виде общей формулы может быть записана следующим

 
 

образом:

Индексы суммирования i, j указывают, что в сумму должны быть включены все возможные

о о

сочетания значений xi и yj.

о о

Величина Rx,y представляет собой среднее значеи е произведений xiна yj и называется в теории вероятностей корреляционным моментом.

 
 

На основании формулы умножения вероятностей случайных величин (93), учитывая, что

 
 

выражение (103) для корреляционного момента можно также записать в виде

(104)

Выражения, аналогичные (103) и (104), могут быть написаны для случая, когда величины Х и Y непрерывны. Заменив суммы интегралами, а вероятности – элементами вероятностей, для непрерывных величин запишем:

 
 

 

Коэффициентом корреляции между двумя случайными величинами, или, иначе, нормированным корреляционным моментом, называется отношение корреляционного момента Rxy к произведению среднеквадратических отклонений случайных величин sх и sy:

 
 

 

Корреляционный момент, как видно из выражений (103) и (105), является величиной размерной. Размерность его равна произведению размерностей отдельных случайных величин. Коэффициент корреляцииrx,y - величина безразмерная. R x,y отличается от rx,y постоянным (для данных случайных величин) множителем 1/sx sy.

Рассмотрим, какими свойствами обладают корреляционный моментRx,y и коэффициент корреляции r. Для этого возвратимся к формуле (104). Положим сначала, что случайные величины Х и Y независимы. Тогда

 
 

 

 

 
 

 

На основании (104) можем записать:

 

 

Вторая сумма в правой части равенства (107), не зависящая в данном случае от хi, представляет собой среднее значение отклонений случайной величины Y в одну и другую стороны от ее среднего значения. Эта величина равна нулю, что следует из факта симметричности положительных и отрицательных отклонений случайной величины относительно среднего значения при учете соответствующих вероятностей. Следовательно, в данном случае Rxy = 0, т. е. если величины независимы, то их корреляционный момент равен нулю. Этот результат понятен. Поскольку мы перемножаем положительные и отрицательные отклонения двух независимых величин с учетом их «весовых» вероятностных коэффициентов, получим в равной мере как положительные, так и отрицательные результаты перемножений. При суммировании они взаимно компенсируются и дают нуль.Следовательно, если величины независимы, равен нулю и коэффициент корреляции:

 
 

(108’)

Рассмотрим теперь другой крайний случай, когда величины Х и Yсвязаны жесткой линейной зависимостью вида:

y=kx, (109)

где k — постоянный коэффициент.

При такой зависимости очевидно, что случайные величины принимают всегда согласованные значения, различающиеся только масштабным коэффициентом k.

Если величина Х принимает какое-либо значение хi, то другая величина Y с условной вероятностью Р(yj / x i), равной 1, принимает значение yj= kxi. Все другие значения y исключаются. Поэтому при заданном xi, можно записать

 
 

 

Подставив это значение суммы в (104), получим:

 
 

 

 
 

Но

Следовательно, в данном случае

 
 

 

где sx 2 — дисперсия случайной величины X.

Можно далее показать, что если одна случайная величина Y принимает значения, каждый раз в k раз большие (меньшие), чем другая случайная величина X, то дисперсия ее в k2 больше (меньше), чем у X:

 
 

Соответственно 6y = ± k 6x. Поэтому значение корреляционного момента (111) может быть переписано в виде

 
 


Знак плюс в правой части равенства соответствует случаю, когда k положительно, минус—когда оно отрицательно.
Таким образом, мы установили, что корреляционный момент в случае линейной функциональной связи между величинами по абсолютному значению равен произведению среднеквадратических отклонений случайных величин. Коэффициент корреляции при этом равен

 
 


Следовательно, в двух крайних случаях связи между случайными величинами коэффициент корреляции оказался равным по абсолютному значению нулю и единице: значение нуль соответствует отсутствию связи, а единица—наиболее тесной (линейной функциональной)
связи между величинами.
Естественно предположить, что в промежуточных случаях, когда связь существует, но не является предельно жесткой, коэффициент корреляции должен иметь

величину, лежащую в промежутке между крайними значениями, т. е. между 0 и ±1. Таким образом, подтверждается, что корреляционный момент и коэффициент корреляции могут служить мерой связи между случайными величинами. Знак плюс у коэффициента корреляции, если величины не жестко связаны, говорит о том, что когда отклонение у одной случайной величины положительно, то оно преимущественно положительно и у другой величины. Если отклонение отрицательно, то оно в большинстве случаев отрицательно у обеих случайных величин. Знак минус говорит, наоборот, о преимущественно разных знаках отклонений у двух случайных величин X и Y.

 
 

 

 

На рис. 54 для примера показаны точки, полученные при совместных измерениях значений двух случайных величин.

 
 

Отметим, что речь идет о линейной связи между величинами. Можно показать, что при нелинейной связи, например вида y = k x, при симметричном законе распределения х, когда

положительные и отрицательные отклонения равновероятны, коэффициент корреляции равен нулю, хотя случайные величины связаны при этом функционально жестко.

Иначе говоря, если коэффициент корреляции равен нулю, это говорит, несомненно, только об отсутствии линейной связи. Однако если связь между величинами (какая бы то ни была) отсутствует (т. е. величины независимы), коэффициент корреляции всегда равен нулю.

В первом случае (рис. 54,а) расположение точек позволяет сделать предположение о наличии положительной корреляции между величинами, а во втором (рис. 54,6) — отрицательной. Пунктиром приблизительно показаны линии, на которые должны были бы ложиться точки в случае, если бы имела место функциональная линейная связь между величинами Х.и Y. На рис. 55 показано характерное расположение точек, ког-

да величины независимы и, следовательно, не коррелироваиы.

Упражнение.

 
 

Определить корреляционный момент и коэффициент корреляции между двумя дискретными, случайными величинами Х и Y, двухмерный закон распределения вероятностей которых задан таблицей.

Ответ: 2,05; 0,208.




Поделиться с друзьями:


Дата добавления: 2015-05-26; Просмотров: 3128; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.028 сек.