КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Корреляция для нелинейной регрессииКорреляция для множественной регрессии. Значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции: где – общая дисперсия результативного признака; – остаточная дисперсия для уравнения . Парная регрессия – регрессия между двумя переменными и , т. е. модель вида: , где – зависимая переменная (результативный признак); , – независимая, объясняющая переменная (признак-фактор); – возмущение, или стохастическая переменная, включающая влияние неучтенных факторов в модели. В случае парной линейной зависимости строится регрессионная модель по уравнению линейной регрессии. Параметры этого уравнения оцениваются с помощью процедур, наибольшее распространение получил метод наименьших квадратов. Метод наименьших квадратов (МНК) – метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции: , где – статические значения зависимой переменной; – теоретические значения зависимой переменной, рассчитанные с помощью уравнения регрессии. Экономический смысл параметров уравнения линейной парной регрессии. Параметр показывает среднее изменение результата с изменением фактора на единицу. Параметр , когда . Если не может быть равен 0, то а не имеет экономического смысла. Интерпретировать можно только знак при : если , то относительное изменение результата происходит медленнее, чем изменение фактора, т. е. вариация результата меньше вариации фактора: , и наоборот. То есть МНК заключается в том, чтобы определить и , так, чтобы сумма квадратов разностей фактических и , вычисленных по этим значениям и , была минимальной: . Рассматривая эту сумму как функцию и , дифференцируем ее по этим параметрам и приравниваем производные к нулю, получаем следующие равенства: ;
– число единиц совокупности (заданных параметров значений и ). Это система «нормальных» уравнений МНК для линейной функции . Расчет параметров уравнения линейной регрессии: , . Нахождение уравнения регрессии по сгруппированным данным. Если совокупность сгруппирована по признаку , для каждой группы найдены средние значения другого признака , то эти средние дают представление о том, как меняется в среднем в зависимости от . Поэтому группировка служит средством анализа связи в статистике. Но ряд групповых средних имеет тот недостаток, что он подвержен случайным колебаниям. Они создают колебания , отражающие не закономерность данной зависимости, а затушевывающий ее «шум». Групповые средние хуже отражают закономерность связи, чем уравнение регрессии, но могут быть использованы в качестве основы для нахождения этого уравнения. Умножая численность каждой группы на групповую среднюю , мы получим сумму в пределах группы. Суммируя эти суммы, найдем общую сумму . Несколько сложнее с суммой . Если при сумме интервалы группировки малы, то можно считать значение для всех единиц в рамках группы одинаковым. Умножив на него сумму , получим сумму произведений на в рамках группы и, суммируя эти суммы, общую сумму . Численность здесь играет такую же роль, как взвешивание в вычислении средних. Множественная регрессия – регрессия между переменными и , , т. е. модель вида: где – зависимая переменная (результативный признак); , – независимые, объясняющие переменные (признак-фактор); Множественная регрессия применяется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах. Цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также их совокупное воздействие на моделируемый показатель. Основные типы функций, используемые при количественной оценке связей: линейная функция: . Параметры называются коэффициентами «чистой» регрессии и характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне; нелинейные функции: – степенная функция; – коэффициенты эластичности; показывают, насколько % изменится в среднем результат при изменении соответствующего фактора на 1 % и при неизменности действия других факторов. – гипербола; – экспонента. Отбор факторов при построении множественной регрессии. Включение в уравнение множественной регрессии того или иного набора факторов связано с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: 1.Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность. 2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. 3.Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Методы построения уравнения множественной регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии к разным методам: · метод исключения (отсев факторов из полного его набора); · метод включения (дополнительное введение фактора); · шаговый регрессионный анализ (исключение ранее введенного фактора). Каждый из этих методов по-своему решает проблему отбора факторов, давая в целом близкие результаты. Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является простота вычислений. Коэффициент ассоциации: . Коэффициент контингенции: .
Коэффициент взаимной сопряженности Пирсона: ; .
Коэффициент Фехнера: . Коэффициент корреляции рангов: . Непараметрические показатели связи позволяют судить о степени и тесноте связи не только для количественных, но и для атрибутивных признаков. Методы многомерного анализа, основанные на рассмотрении сочетания непараметрических взаимосвязанных признаков: · дискриминантный анализ состоит в установлении правила, на основании которого та или иная новая единица не может быть отнесена к данной совокупности объектов, имея в виду значения рассматриваемых у нее признаков; · распознавание образов состоит в отнесении объекта на основании сочетания признаков в ту или другую из заранее определенных и охарактеризованных групп совокупности; · кластерный анализ (таксономия) состоит в разбиении совокупности на классы (группы, типы, «кластеры», «таксоны»), границы которых наперед не заданы. Число кластеров может быть при этом задано или нет; · метод главных компонент – если признаки отобраны правильно и в них действительно отражается качественная природа объектов в рассматриваемом отношении, то эти признаки оказываются друг с другом связанными; · факторный анализ является дальнейшим развитием метода главных компонент. В нем охватываемая выделенными «главными компонентами» вариация всех признаков может затем между ними перераспределяться, причем между ними может быть допущена и корреляция.
Дата добавления: 2014-12-29; Просмотров: 754; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |