Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Если , то случайные величины Х и Y называются некоррелирванными

З а м е ч а н и е. Можно доказать, что некоррелированные нормально распределенные случайные величины Х и Y будут независимы.

Коэффициент корреляции характеризует меру линейной зависимости Х и Y: если , то между Х и Y существует «почти» линейная зависимость.

Коэффициент корреляции можно вычислять по формуле

.

Действительно,

.

Докажем, что для любых случайных величин Х и Y, имеющих дисперсии и коэффициент корреляции , справедливо равенство

.

Действительно,

.

Можно доказать, что наилучшей оценкой (в смысле минимума среднего квадрата ошибки) случайной величины Y при фиксированном значении Х = = х, является регрессия Y по Х, т.е. = М (Y / Х = х). Поэтому вычисление условных математических ожиданий (регрессий) М (Y / Х = х) или М (Х / Y = у) представляет большой интерес. Однако вычислить регрессии по формулам (5.1) затруднительно, поскольку условные плотности вероятностей или и условные вероятности или известны неточно. Кроме того, ошибки, обусловленные численными расчетами по формулам (5.1), приводят к тому, что регрессия Y по Х (или Х по Y) определяется приближённо.

 

5.2. Линейная регрессия

 

Найдем наилучшее в смысле минимума среднего квадрата ошибки приближение регрессии Y по Х прямой = ах + b. И задача состоит в нахождении параметров а и b этой прямой.

Представим Y в виде , где - ошибки приближения (аппроксимации) случайной величины Y линейной функцией аХ + b. Коэффициенты а, b будем искать из условия минимума среднего квадрата ошибки аппроксимации, т.е. из условия достижения минимума целевой функцией . Определив их, получим:

,

где прямая, описываемая уравнением , является лучшим линейным приближением регрессии .

Вначале получим функцию в явном виде. Обозначения оставим прежними:

.

Имеем,

Итак, . Эта функция непрерывна и дифференцируема при любых значениях параметров а и b. Если , то функция неограниченно возрастает, и поэтому её наименьшее значение достигается в некоторой критической точке. Как известно, критические точки находятся из решения системы двух уравнений: и .

Вычисление частных производных функции J (a, b) по переменным a, b даёт следующий результат:

Решив систему двух линейных уравнений с двумя неизвестными a и b

,

найдём: .

Итак, наилучшее линейное приближение регрессии Y по Х, определяется по формуле

.

Проводя аналогичные вычисления, можно получить наилучшее линейное приближение регрессии Х по Y:

.

- Таким образом, наилучшие линейные оценки случайных величин Y и Х при фиксированных значениях Х = х или Y = y вычисляются по формулам (5.3):

- , (5.3)

Эти уравнения описывают на плоскости 0ху две прямые, каждая из которых проходит через точку (mx, my). Видно также, что для вычисления наилучших линейных оценок регрессий требуется только значения математических ожиданий, дисперсий и коэффициента корреляции Х и Y, а знание законов их распределения не обязательно.

Рассмотрим в заключение один чрезвычайно важный для решения практических задач вопрос.

Пусть имеется n пар измерений случайного вектора . И больше никакой информации о нём нет. По данным измерений можно получить оценки величин (как это делается, будет изложено в следующей главе). Тогда результаты измерений позволяют найти прямые регрессий Y по Х или Х по Y с помощью формул (5.3). Но возникает вопрос, можно ли это делать? Другими словами, не будут ли ошибки, совершаемые при замене условных математических ожиданий М (Y / Х = x) и M (Х / Y = y) величинами , слишком большими. Ведь в этом случае применение формул (5.3) существенно исказит результаты предсказания Y или Х при заданных значениях Х = х или Y = y? Дадим качественный ответ на поставленный вопрос.

Рассмотрим рис. 5.2, на котором в двух вариантах точками изображены результаты нескольких измерений случайного двумерного вектора (Х, Y): . По рис. 5.2 а видно, что результаты измерений группируются около некоторой прямой, и поэтому использовать формулы (5.3) для оценки регрессий Y по Х или Х по Y целесообразно. В то же время рис. 5.2 б показывает, что экспериментальные точки не сконцентрированы вокруг какой-то прямой, а скорее они разбросаны относительно некоторой параболы , где а > 0. И в этом случае целесообразно представить зависимость Y от Х в виде . Параметры параболы а, b, с следует искать, исходя из условия достижения функцией наименьшего значения. Тогда можно получить наилучшее квадратичное приближение регрессии Y по Х, т.е. .

y a y б

* * * * *

* * * * *

* * * * *

* * * * *

* *

0 х 0 х

Рис. 5.2

<== предыдущая лекция | следующая лекция ==>
План лекции. Лекция 5. Корреляция и регрессия | Лекция 4. К тестам К приложению К дополнению
Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 443; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.