КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Исследование модели парной линейной регрессии
а). Параметр называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. b). Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции , который можно рассчитать по следующим формулам: . . Чем ближе абсолютное значение к единице, тем сильнее линейная связь между факторами (при имеем строгую функциональную зависимость). Но следует иметь в виду, что близость абсолютной величины линейного коэффициента корреляции к нулю еще не означает отсутствия связи между признаками. При другой (нелинейной) спецификации модели связь между признаками может оказаться достаточно тесной. c). Коэффициент детерминации 2 ( используетсядля оценки качества подбора линейной функции ) характеризует долю дисперсии результативного признака , объясняемую регрессией, в общей дисперсии результативного признака: , где , . Величина характеризует долю дисперсии , вызванную влиянием остальных, не учтенных в модели, факторов. После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров. d). Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации: . Средняя ошибка аппроксимации не должна превышать 8–10%. e). Оценка значимости уравнения регрессии в целом производится на основе -критерия Фишера , , . Фактическое значение -критерия Фишера сравнивается с табличным значением при уровне значимости и степенях свободы и . При этом, если фактическое значение -критерия больше табличного, то признается статистическая значимость уравнения в целом. f). В парной линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: и . Стандартная ошибка коэффициента регрессии определяется по формуле: , где – остаточная дисперсия на одну степень свободы. Величина стандартной ошибки совместно с -распределением Стьюдента при степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительного интервала. Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение -критерия Стьюдента: которое затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы . Доверительный интервал для коэффициента регрессии определяется как . Поскольку знак коэффициента регрессии указывает на рост результативного признака при увеличении признака-фактора (), уменьшение результативного признака при увеличении признака-фактора () или его независимость от независимой переменной () (см. рис. 1.3), то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, . Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Стандартная ошибка параметра определяется по формуле: . Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется -критерий: , его величина сравнивается с табличным значением при степенях свободы.
Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции : . Фактическое значение -критерия Стьюдента определяется как . Существует связь между -критерием Стьюдента и -критерием Фишера: . (1.15) В прогнозных расчетах по уравнению регрессии определяется предсказываемое значение как точечный прогноз при , т.е. путем подстановки в уравнение регрессии соответствующего значения . Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки , т.е. , и соответственно интервальной оценкой прогнозного значения : , где , а – средняя ошибка прогнозируемого индивидуального значения: .
Требования к качеству оценок параметров: Теория статистического оценивания качество оценок определяет по свойствам несмещенности, эффективности, асимптотической несмещенности и асимптотической эффективности, состоятельности и некоторым другим. Напомним, что оценка является несмещенной, если истинное значение параметра можно рассматривать как ее математическое ожидание или, иначе, математическое ожидание ошибки оценки D ai должно быть равно нулю:
M [ a i ]= a i, M [D a i ]=0. (1.48)
Оценка рассматривается как эффективная, если она характеризуется наименьшей дисперсией (дисперсия ошибки оценки минимальна) среди всех других аналогичных оценок, полученных различными методами, способами.
– дисперсия оценки, полученной с использованием j -го метода оценивания. Часто свойство несмещенности выполняется лишь с некоторой степенью «приблизительности» при достаточно больших объемах выборочных данных (при большом числе измерений Т), в пределе при Т ®¥. В этом случае говорят, что оценки являются асимптотически несмещенными. Иногда асимптотическая несмещенность рассматривается в “вероятностном” смысле, т. е. предполагается, что для произвольно малых положительных чисел x и h, в общем случае зависящих от Т, существует такой объем исходных данных Т 0, что для всех Т > Т 0 имеет место следующее неравенство:
Дата добавления: 2014-01-07; Просмотров: 533; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |