Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Оценка статистической значимости параметров взаимосвязи





 

Получив оценки параметров регрессии и корреляции, необходимо убедиться, что эти значения не случайны и действительно выражают наличие, характер и тесноту зависимости признаков. Для оценки не случайности того или иного параметра или коэффициента вводится понятие уровня значимости. Уровень значимости это, в первом приближении, вероятность того, что полученное численное значение конкретного параметра (коэффициента корреляции или параметра регрессии) можно считать величиной случайной. Таким образом, чем меньше численное значение уровня значимости, тем с большей вероятностью можно утверждать, что данный параметр является неслучайным. Для экономических задач обычно достаточно, чтобы уровень значимости был численно не более 0,05 или даже 0,10. Для статистического анализа технических систем, связанных с обеспечением жизнедеятельности, уровень значимости принимается гораздо более строгим (например, не более 0,01; 0,001 или 0,0005 и т.п.).

Системы анализа статистических данных на ЭВМ обязательно включают процедуры оценки значимости. Используют любую из двух равнозначных методик. По первой, традиционной, методике исследователь задает численную оценку уровня значимости, например α = 0,05. Под эту вероятность выбирается табличное значение t-статистики Стьюдента, если оценивается значимость параметра регрессии либо коэффициента парной линейной корреляции, или табличное значение F-статистики Фишера-Снедекора для оценки значимости уравнения регрессии в целом. Далее величина конкретного полученного параметра регрессии или коэффициента корреляции пересчитывается в фактическое значение t-статистики, а для уравнения регрессии в целом в фактическое значение F-статистики. Фактические t-статистики показывают, на сколько средних квадратических отклонений соответствующий фактический параметр регрессии или корреляции отклонился от своего гипотетического нулевого среднего уровня. Для коэффициента парной линейной корреляции и параметра а1 в уравнении парной регрессии фактическое значение t-статистики определяют Для параметра а0:

где n – количество наблюдений; r2XY – коэффициент линейной корреляции признаков X и Y.

Для оценки значимости параметров множественной линейной регрессии: а0, а1, …, аk – соответствующие значения фактических t-статистик равны

В этой формуле aii-й параметр уравнения регрессии; σi – среднее квадратическое отклонение i-го параметра. Такая методика принята в системах статистического анализа данных на ПЭВМ.

Если фактическое значение t-статистики Стьюдента больше табличного значения (tтабл), то утверждается, что коэффициент корреляции или параметр регрессии статистически значим с уровнем, не менее α.



Согласно второй методике, определив фактическую величину t-статистики параметра регрессии, оценивают вероятность того, что за счет случайных причин эта величина могло бы быть еще большей. Если эта вероятность мала (меньше заданного численного значения уровня α), то найденный параметр признается статистически значимым. Эта методика является обычной при расчетах в системах статистического анализа данных на ПЭВМ.

При назначении табличного значения t-статистики необходимым параметром является число степеней свободы (ν). Для анализа парных линейных зависимостей число степеней свободы равно количеству наблюдений за минусом 2 (числа параметров регрессии в уравнении парной линейной связи), т.е. ν=n-2. Для уравнений множественной линейной регрессии соответственно имеем

ν = n-(k+1) = n–m,

где m – количество параметров в уравнении регрессии, n – количество наблюдений, по которым составляется уравнение множественной регрессии.

Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, определяя расчетное (фактическое) значение F-статистики. На основе квадрата коэффициента множественной корреляции (R2), числа наблюдений (n) и количества параметров в уравнении множественной линейной регрессии (m) определяем

.

Полученное по этой формуле значение Fрасч также должно быть больше Fтеор (табличного) при v1=m–1 и v2=nm степенях свободы и выбранном уровне значимости α.

(Величина F-статистики показывает, во сколько раз факторная дисперсия признака результата Y превышает его остаточную дисперсию. При расчете учитываются соответствующие степени свободы).

 

По второй методике определяется вероятность еще большего значения F (при тех же степенях свободы v1=m–1 и v2=nm). Эта вероятность должна быть меньше принятого числа α, иначе следует пересмотреть форму уравнения, перечень переменных и т.д.





Дата добавления: 2014-01-03; Просмотров: 636; Нарушение авторских прав?


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



ПОИСК ПО САЙТУ:


Рекомендуемые страницы:

Читайте также:
studopedia.su - Студопедия (2013 - 2020) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление
Генерация страницы за: 0.002 сек.