Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Парная регрессия




Регрессионный анализ. Уравнение регрессии. Стандартная ошибка оценки. Коэффициент детерминации.

Оценка достоверности коэффициента корреляции, полученного методом ранговой корреляции и методом квадратов

Вычисление ошибки коэффициента корреляции

o ошибка коэффициента корреляции, вычисленного методом квадратов (Пирсона):

 

o ошибка коэффициента корреляции, вычисленного ранговым методом (Спирмена):

 

Способ 1
Достоверность определяется по формуле:

 

Критерий t оценивается по таблице значений t с учетом числа степеней свободы (n — 2), где n — число парных вариант. Критерий t должен быть равен или больше табличного, соответствующего вероятности р ≥99%.

Способ 2
Достоверность оценивается по специальной таблице стандартных коэффициентов корреляции. При этом достоверным считается такой коэффициент корреляции, когда при определенном числе степеней свободы (n — 2), он равен или более табличного, соответствующего степени безошибочного прогноза р ≥95%.

 

Регрессионный анализ (regression analysis) — это мощный и гибкий метод установления формы и изучения связей между метрической зависимой переменной и одной или несколькими независимыми переменными.

Регрессионный анализ используют в следующих случаях.

1. Действительно ли независимые переменные обуславливают значимую вариацию зависимой переменной; действительно ли эти переменные взаимосвязаны?

2. В какой степени вариацию зависимой переменной можно объяснить независимыми переменными: теснота связи?

3. Определить форму связи: математическое уравнение, описывающее зависимость между зависимой и независимой переменными.

4. Предсказать значения зависимой переменной.

5. Контролировать другие независимые переменные при определении вкладов конкретной переменной.

Парная регрессия (bivariate regression) — это метод установления математической (в форме уравнения) зависимости между одной метрической зависимой (критериальной) переменной и одной метрической независимой переменной (предиктором). Во многом этот анализ аналогичен определению простой корреляции между двумя переменными. Однако для того чтобы вывести уравнение, мы должны одну переменную представить как зависимую, а другую — как независимую.

Статистики и термины, относящиеся к парному регрессионному анализу.

Модель парной регрессии. Основное уравнение регрессии имеет вид:

Yi=­­­­β0+ βiXi+ ei

Где Y - зависимая или критериальная переменная, X— независимая переменная, или предиктор,

­­­­β0 — точка пересечения прямой регрессии с осью OY;

βi — тангенс угла наклона прямой

ei — остаточный член (остаток), связанный с наблюдением, характеризующий отклонение от функции регрессии.

Коэффициент детерминации. Тесноту связи измеряют коэффициентом детерминации r2. Он колеблется в диапазоне между 0 и 1 и указывает на долю полной вариации Y, которая обусловлена вариацией X.

Вычисляемое (теоретическое) значение Y. Вычисляемое значение Y равно i= а + bх, где

i — вычисляемое значение Уi, а параметры а и b — это вычисляемые оценки β0 и β1 соответственно.

Коэффициент регрессии. Вычисляемый параметр b обычно называют ненормированным коэффициентом регрессии.

Стандартная ошибка уравнения регрессии - Эта статистика SEE представляет собой стандартное отклонение фактических значений Y теоретических значений

Стандартная ошибка коэффициента регрессии b. Стандартное отклонение b, обозначаемое SEb, называется стандартной ошибкой.

Нормированный коэффициент регрессии. Также называется бета-коэффициентом, или взвешенным бета-коэффициентом. Показывает изменение У в зависимости от изменения X (угол наклона прямой уравнения регрессии) при условии, что все данные нормированы.

Сумма квадратов ошибок. Значения расстояний всех точек до линии регрессии возводят в квадрат и суммируют, получая сумму квадратов ошибок, которая является показателем общей ошибки e.

t-статистика, t-статистику с n-2 степенями свободы можно использовать для проверки нулевой гипотезы, которая утверждает, что между X и У не существует линейной зависимости или H0: =0, где t=

Стадии, из которых состоит процедура парного регрессионного анализа:

1)-построение поля корреляции

2)-формирование общей модели

3)-вычисление параметров

4)-вычисление нормированного коэффициента регрессии

5)-проверка значимости

6)-определение тесноты и значимости связи

7)-проверка точности предсказания

8)-анализ остаточных членов

9)-перекрёстная проверка модели

Диаграмма рассеяния (поле корреляции). Поле корреляции — это графическое представление точек с координатами, определяемыми значениями двух переменных (независимой и зависимой), для всех наблюдений.

Обычно значения зависимой переменной откладывают по вертикальной оси, в значения независимой — по горизонтальной. На графике легко идентифицировать любую необычную комбинацию переменных. График зависимости У (отношение к городу) от X(продолжительность проживания)

На графике можно увидеть форму зависимости: с ростом одной переменной другая переменная также увеличивается. Из рисунка видно, что зависимость между У и X носит линейный характер и поэтому может быть описана уравнением прямой линии. Самый распространенный метод для расчета уравнения линейной регрессии по данным на диаграмме рассеяния — это метод наименьших квадратов (least-squares procedure).

 




Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 701; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.