Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляция для нелинейной регрессии




Корреляция для множественной регрессии. Значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детер­минации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого на­бора факторов с исследуемым признаком, или оце­нивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

где – общая дисперсия результативного признака;

– остаточная дисперсия для уравнения

.

Парная регрессия – регрессия между двумя пе­ременными и , т. е. модель вида: , где – зависимая переменная (результативный признак); , – независимая, объясняющая переменная (признак-фактор); – возмущение, или стохастическая пере­менная, включающая влияние неучтенных факторов в модели. В случае парной линейной зависимости строится регрессионная модель по уравнению линей­ной регрессии. Параметры этого уравнения оценива­ются с помощью процедур, наибольшее распростра­нение получил метод наименьших квадратов.

Метод наименьших квадратов (МНК) – метод оценивания параметров линейной регрессии, миними­зирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции: ,

где – статические значения зависимой переменной;

– теоретические значения зависимой перемен­ной, рассчитанные с помощью уравнения регрес­сии.

Экономический смысл параметров уравне­ния линейной парной регрессии. Параметр показывает среднее изменение результата с из­менением фактора на единицу. Параметр , когда . Если не может быть равен 0, то а не имеет экономического смысла. Интерпретировать можно только знак при : если , то относитель­ное изменение результата происходит медленнее, чем изменение фактора, т. е. вариация результата меньше вариации фактора: , и наоборот.

То есть МНК заключается в том, чтобы определить и , так, чтобы сумма квадратов разностей фак­тических и , вычисленных по этим значениям и , была минимальной: .

Рассматривая эту сумму как функцию и , диф­ференцируем ее по этим параметрам и приравнива­ем производные к нулю, получаем следующие ра­венства:

;

 

– число единиц совокупности (заданных пара­метров значений и ). Это система «нормальных» уравнений МНК для линейной функции .

Расчет параметров уравнения линейной регрессии:

, .

Нахождение уравнения регрессии по сгруп­пированным данным. Если совокупность сгруппи­рована по признаку , для каждой группы найдены средние значения другого признака , то эти средние дают представление о том, как меняется в среднем в зависимости от . Поэтому группировка служит средством анализа связи в статистике. Но ряд груп­повых средних имеет тот недостаток, что он под­вержен случайным колебаниям. Они создают колеба­ния , отражающие не закономерность данной зависимости, а затушевывающий ее «шум».

Групповые средние хуже отражают закономер­ность связи, чем уравнение регрессии, но могут быть использованы в качестве основы для нахож­дения этого уравнения. Умножая численность каж­дой группы на групповую среднюю , мы полу­чим сумму в пределах группы. Суммируя эти суммы, найдем общую сумму . Несколько сложнее с суммой . Если при сумме интервалы группировки малы, то можно считать значение для всех единиц в рам­ках группы одинаковым. Умножив на него сумму , получим сумму произведений на в рамках группы и, суммируя эти суммы, общую сумму . Числен­ность здесь играет такую же роль, как взвешива­ние в вычислении средних.

Множественная регрессия – регрессия между переменными и , , т. е. модель вида:

где – зависимая переменная (результативный при­знак);

, – независимые, объясняющие пере­менные (признак-фактор);
– возмущение, или стохастическая переменная, включающая влияние неучтенных факторов в мо­дели.

Множественная регрессия применяется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономи­ческих расчетах. Цель множественной регрес­сии – построить модель с большим числом факто­ров, определив при этом влияние каждого из них в отдельности, а также их совокупное воздействие на моделируемый показатель.

Основные типы функций, используемые при количественной оценке связей: линейная функ­ция: . Параметры называются коэффициентами «чистой» регрессии и характеризуют среднее изменение ре­зультата с изменением соответствующего фактора на единицу при неизменном значении других факто­ров, закрепленных на среднем уровне; нелинейные функции: – степенная функция; – коэффициенты эластичности; по­казывают, насколько % изменится в среднем резуль­тат при изменении соответствующего фактора на 1 % и при неизменности действия других факторов.

– гипербола;

– экспонента.

Отбор факторов при построении множествен­ной регрессии. Включение в уравнение множествен­ной регрессии того или иного набора факторов связа­но с представлением исследователя о природе взаимосвязи моделируемого показателя с другими эко­номическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следую­щим требованиям:

1.Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой ин­теркорреляцией может привести к нежелательным последствиям – система нормальных уравнений мо­жет оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэф­фициентов регрессии.

3.Если между факторами существует высокая кор­реляция, то нельзя определить их изолированное влияние на результативный показатель и парамет­ры уравнения регрессии оказываются неинтерпретируемыми.

Методы построения уравнения множествен­ной регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии к разным методам:

· метод исключения (отсев факторов из полного его набора);

· метод включения (дополнительное введение фактора);

· шаговый регрессионный анализ (исключение ранее введенного фактора).

Каждый из этих методов по-своему решает проб­лему отбора факторов, давая в целом близкие ре­зультаты.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является простота вы­числений.

Коэффициент ассоциации:

.

Коэффициент контингенции:

.

 

Коэффициент взаимной сопряженности Пирсона:

; .

 

Коэффициент Фехнера:

.

Коэффициент корреляции рангов:

.

Непараметрические показатели связи позволя­ют судить о степени и тесноте связи не только для количественных, но и для атрибутивных при­знаков.

Методы многомерного анализа, основанные на рассмотрении сочетания непараметрических взаимо­связанных признаков:

· дискриминантный анализ состоит в установ­лении правила, на основании которого та или иная новая единица не может быть отнесена к данной совокупности объектов, имея в виду значения рассматриваемых у нее признаков;

· распознавание образов состоит в отнесении объекта на основании сочетания признаков в ту или другую из заранее определенных и охаракте­ризованных групп совокупности;

· кластерный анализ (таксономия) состоит в разбиении совокупности на классы (группы, типы, «кластеры», «таксоны»), границы которых наперед не заданы. Число кластеров может быть при этом задано или нет;

· метод главных компонент – если признаки отобраны правильно и в них действительно отра­жается качественная природа объектов в рассматриваемом отношении, то эти признаки оказываются друг с другом связанными;

· факторный анализ является дальнейшим развитием метода главных компонент. В нем охватываемая выделенными «главными компонента­ми» вариация всех признаков может затем между ними перераспределяться, причем между ними может быть допущена и корреляция.




Поделиться с друзьями:


Дата добавления: 2014-12-29; Просмотров: 754; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.