Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Понятие регрессии




Рассмотрим двумерную случайную величину (ξ,η). Пусть, например, ξ - рост человека, а η - его вес. Ясно, что между весом и ростом существует зависимость, но эта зависимость вероятностная, ее нельзя записать в виде функции. Однако зависимость усредненных величин можно записать в виде функции. Если плотность f(x,y) непрерывной случайной величины известна, то можно найти условные плотности f1(x/y), f2(y/x) и условные математические ожидания

(1)

(2)

В нашем примере М[hïx] -это средний вес людей, рост которых одинаковый, x=x; а M[xïy] - это средний рост людей одинакового веса, h=y.

Формулы (1) и (2) дают функциональную зависимость условных математических ожиданий одной случайной величины от возможных значений другой. Функция y=g(x) называется регрессией величины h на x, а функция x=q(y) - регрессией величины x на h. Графики функций g(x) и q(y) называются кривыми регрессии.

Аналогично можно найти и другие условные числовые характеристики, например, условную дисперсию

(3)

Условная дисперсия D[h/x] определяет рассеяние случайной величины h/x относительно регрессии g(x). Т.к. эта дисперсия является функцией возможных значений случайной величины x (D[h/x]=j(x)), т.е. величиной случайной, то ее усредняют, находят ее математическое ожидание. В результате усреднения получим:

(4)

Здесь f1(x) - плотность распределения случайной величины x. С учетом того, что f1(x)f2(y/x)=f(x,y), формула (4) принимает вид:

(5)

Как видно из (5), d - это безусловная дисперсия случайной величины h относительно своего центра распределения g(x). Известно, что дисперсия(рассеяние) относительно центра распределения минимальная. Отсюда вывод: если регрессию g(x) взять в качестве оценки зависимости h от x (h≈g(x)), то это будет наилучшая оценка этой зависимости в смысле минимума средней квадратичной погрешности.

Если случайная величина (x,h) дискретная с конечным числом возможных значений, то условные математические ожидания вычисляются по формулам:

(6)

(7)

Пример 1. Найти условные математические ожидания M[ξ/y1] и M[ξ/y2] случайной дискретной величины (x,h) примера 1 §14.

Решение: условные законы распределения случайных величин ξ/y1 и ξ/y2 найдены в примере 1 §15. Используя эти законы, по формуле (7) найдем

M[ξ/y1]=1×0,30+3×0,12+4×0,5+8×0,08=3,3,

M[ξ/y2]=1×0,6+3×0,2+4×0,06+8×0,14=2,56.

Пример 2. Случайная величина (x,h) задана своей плотностью распределения

Найти регрессии h на x и x на h.

Решение. Условные плотности f2(y/x) и f1(x/y) найдены в примере 2 §15. Используя их, по формулам (1) и (2) найдем

Итак, y=g(x)= -x/3 - это регрессия h на x.

Аналогично

Таким образом, x=q(y)=2-3y/4 - регрессия x на h.

Как видно, обе регрессии линейные (см. рис. 20). Можно доказать, что если закон распределения случайной величины (x,h) нормальный, то регрессии x на h и h на x

 

будут линейными, а прямые регрессии проходят через центр симметрии (mξ,mη).

Пример 3. Найти регрессии, если случайная величина (x,h) задана своей плотностью распределения

Решение. Найдем сначала плотности распределения компонент ξ и η вектора (ξ,η):

Найдем теперь условные плотности распределения:

 
 

Заметим, что данная и все найденные плотности распределения отличны от нуля только в первом квадранте.

 
 
 
 
 
 
Согласно формулам (1) и (2) найдем:

Итак, y=g(x)=1+1/(1+x) и x=q(y)=1+1/(1+y) - регрессии соответственно h на x и x на h. Кривые регрессии изображены на рисунке 21.

 




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 310; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.