КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Множественная корреляция. Лекция 9. Множественная линейная регрессия
Лекция 9. Множественная линейная регрессия. Оценка значимости Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции: (3.1) где S S ост – остаточная сумма квадратов для уравнения y = f (x 1, x 2,…, xp); S Sобщ – общая сумма квадратов результативного признака. Методика построения индекса множественной корреляции аналогична построению индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции: . При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем и четвертом знаках). Сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение того или иного фактора. Так, если y рассматривается как функция x и z и получен индекс множественной корреляции Ryzx = 0,85, а индексы парной корреляции при этом были Ryx = 0,82 и Ryz = 0,75, то совершенно ясно, что уравнение парной регрессии y = f (x) охватывало 67,2 % колеблемости результативного признака под влиянием фактора x, а дополнительное включение в анализ фактора z увеличило долю объясненной вариации до 72,3 %, т.е. уменьшилась доля остаточной вариации на 5,1 % (с 32,8 % до 27,7 %). В рассмотренных показателях множественной корреляции (индекс и коэффициент) используется остаточная сумма квадратов, которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений п. Если число параметров при xj равно т и приближается к объему наблюдений, то остаточная сумма квадратов будет близка к нулю и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, применяется скорректированный (нормированный) индекс (коэффициент) множественной корреляции Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов делится на число степеней свободы остаточной вариации (п – т), а общая сумма квадратов отклонений – на число степеней свободы в целом по совокупности (п – 1). Формула скорректированного индекса множественной детерминации имеет вид: , (3.3) где п – число наблюдений; т – число параметров при переменных Чем больше величина т, тем сильнее различия и R 2. Для линейной зависимости признаков скорректированный коэффициент множественной корреляции определяется по той же формуле, что и индекс множественной корреляции, т.е. как корень квадратный из . Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F -критерия Фишера: (3.5) где s 2факт – факторная дисперсия на одну степень свободы; R 2 – коэффициент (индекс) множественной детерминации; n – число наблюдений; m – число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов); s 2ост – остаточная дисперсия на одну степень свободы. Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F -отношения, т.е. критерий F: . При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением: (3.8) где bxi – стандартизованные коэффициенты регрессии; ryxi – парные коэффициенты корреляции результата с каждым фактором. Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции или совокупного коэффициента корреляции.
Дата добавления: 2014-01-03; Просмотров: 1498; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |