КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Й учебный вопрос. Множественная нелинейная регрессия
Если связь между результативным признаком и анализируемыми факторами нелинейна, то выбранная для ее описания нелинейная многофакторная модель (степенная, показательная и т.д.): Степенная - Экспонента – Гипербола – может быть сведена к линейной путем линеаризации.
Помимо уравнения линейной множественной регрессии в множественном регрессионном анализе может быть использовано соотношение (117)
Логарифмируем левую и правую часть уравнения (117). В итоге получим
Неизвестные значения параметров ln a0, a1, a2, … am, находятся с помощью метода наименьших квадратов. Значение параметра a0 находится с помощью соотношения При наличии трех и более факторов достаточно сложно без наличия ПК и соответствующего программного продукта решать систему из четырех и, естественно, большего числа уравнений. С учетом выше изложенного рассмотрим упрощенный и приближенный подход к определению значений параметров уравнении линейной множественной регрессии Данный подход решает указанную выше задачу в три этапа. На первом этапе определяются приближенные значения параметров
Будем считать, что окончательные значения параметров a1, a2, … ak с помощью соотношений (120)
где d – неизвестное значение поправочного коэффициента. Значение коэффициента d определяется с помощью метода наименьших квадратов, целевая функция которого имеет вид (121)
Аргументом данной функции
Значение поправочного коэффициента d находится по формуле
Далее находится значение параметра a0. Для этого используется целевая функция (124)
Данная функция
Тогда значение параметра а0 определяется по формуле (126)
В общем случае можно предположить, что одному произвольно взятому значению независимой переменной Х соответствует некоторая совокупность значений зависимой переменной Y. Пусть число случаев, когда одному и тому же значению независимой переменной Х соответствует некоторая совокупность значений зависимой переменной Y, равняется M. Для каждого m случая значению независимой переменной Хm соответствует Nm совокупность зависимой переменной В этом случае для каждого значения
где
Возможны два варианта. Первый вариант характеризуется тем, что является справедливым соотношением (129)
В этом случае можно говорить о гомоскедастичности зависимости зависимой переменной Y от независимой переменной Х. Если же соотношение (129) не выполняется, то зависимость между независимой и зависимой переменной Х и Y является гетероскедастичной. В последнем варианте вместо метода наименьших квадратов целесообразно использовать обобщенный метод наименьших квадратов. Суть последнего из указанных выше методов заключается в следующем. Находится среднее значение дисперсии
Далее определяются значения весовых коэффициентов Km
Предположим, что заданная функция, связывающая между собой значения независимой и зависимой переменной Х и Y имеет вид
Обозначим эту функцию через
После использования метода наименьших квадратов необходимо проверить точность решения задачи, связанной с определением неизвестных значений параметров заданий функции. Для этого находятся: - значения остатков En, формуле (135)
- среднеквадратичное значение остатков – по формуле (136)
- среднее значение зависимой переменной Y – по формуле (137)
- процент ошибки, относящейся к среднему значению зависимой переменной Y – по формуле (138)
Кроме того, необходимо проверить коррелированность остатков
Если значение показателя d является незначительным, то это свидетельствует о том, что заданная функция регрессии выбрана правильно. При исследовании экономических процессов нередко возникают ситуации, когда значение результирующего признака в текущий момент времени формируется под воздействием ряда факторов, действующих в прошлые моменты времени t-1, t-2 и т.д. Величину, характеризующую запаздывание в воздействии фактора на результат, называют лагом, а временные ряды самих факторов переменных, сдвинутые на один и более интервалов времени – лаговыми переменными. В этом случае уравнение регрессии, если рассматривать независимую переменную Х и зависимую переменную Y, определяется соотношением (140)
Наряду с лаговыми значениями независимых или факторных переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. В этом случае может использоваться уравнение регрессии вида (141)
Для определения значений параметров уравнения (140) может быть использован метод, предложенный Койком. Последний предложил, что существует постоянный темп Учитывая это обстоятельство, уравнение (140) приводится к виду (142)
Запишем те же уравнения, только для момента времени t-1. в результате получим уравнение (143)
Умножим обе части уравнения (143) на l. В итоге получим
Вычтем соотношение (144) из соотношения (142), в результате чего получим
Пренебрежем значениями
Введем обозначение
В этом случае уравнение (146)преобразуется к виду (148)
С помощью метода наименьших квадратов находятся неизвестные значения параметров a*, b0 и λ. Для этого используется целевая функция (149)
Обозначим
Задачу, связанную с определением значений параметров a*, b0 и λ, можно решать последовательно. В этом случае сначала используется целевая функция
Далее для определения значения параметра b0 используется целевая функция
Для определения значения параметра a* используется целевая функция
Значение параметра a находится по формуле (153)
Значения параметров b1, b2, b3 и т.д.находятся по формулам (155)-(157)
и т.д. При определении значений параметров уравнений (140) и (141) можно использовать также следующий подход. В соответствии с ним, если взять уравнение (140), определяются значения коэффициентов линейной парной корреляции Далее предполагается справедливость соотношений (158) для уравнения (140) и (159) для уравнения (141)
где k – коэффициент, значение которого является неизвестным. Значение данного коэффициента может быть найдено с помощью метода наименьших квадратов. При решении данной задачи используется соотношение (160)
В данном выражении Выражение Это можно доказать следующим образом. Пусть Тогда имеем:
Известно, что
из соотношения (162) находится формула (164)
из соотношения (163) находится формула (165)
Подставим выражения (164) и (165) в соотношение (161). В итоге получим
В результате является справедливым соотношение (167)
Выражение Выражение Находим общую, факторную и остаточную дисперсию, относящуюся на 1 степень свободы, используя формулу (168), (169) и (170)
Для оценки значимости статистических показателей используется F критерий, значение которого рассчитывается по формуле (171)
Найдем связь F критерия с коэффициентом детерминации r2, где r – коэффициент линейной парной корреляции. Для начала преобразуем выражение
Являются справедливым соотношения
В итоге получаем
Далее преобразуем выражение
Являются справедливым выражения
В результате выражение (179) преобразуется к виду (185)
Подставим выражения (178) и (185) а соотношение (171). В результате получим
Для оценки значимости статистических показателей используется t – статистика (закон Стьюдента) и F – статистика (закон Фишера). t – статистика используется в предположении наличия линейных взаимосвязей, F – статистика – в предположении наличия нелинейных взаимосвязей. tr – статистика (ее расчетное значение) определяется по формуле (187)
Она используется при оценке значимости коэффициента линейной парной корреляции r. Для оценки значимости коэффициента линейной парной корреляции из таблицы t – распределения Стьюдента находится табличное значение Если tr > Для использования F – распределения вместо r2 вводится R2. Этот показатель показывает какая часть вариации зависимой переменной Y обусловлена вариацией ее факторной составляющей.
В этом случае преобразуется к виду
где m – число параметров уравнений регрессии (или число уравнений, необходимых для определения значений параметров). Для оценки значимости статистических показателей с помощью распределения Фишера находится расчетное и табличное значение F – критерия (Fрасч и Fтабл). При определении табличного значения F – критерия задается Если Fрасч > Fтабл, это означает значимость определенных значений параметров регрессионной зависимости. При m=2 формула (189) преобразуется у виду (190)
При m=3 формула (189) преобразуется к виду
Помимо оценки значимости параметров линейной функции регрессии может определятся интервальная оценка данной функции. Пусть
Тогда имеем
Возьмем дисперсию от левой и правой части выражения (194). В результате получим
Найдем
Значение параметра b может определяться с помощью соотношения (197)
Тогда значение
В итоге
Предположим, что существует точное значение Предполагается, что t статистика значения
Значение
Для определения значения доверительного интервала математического ожидания случайной величины можно использовать формулу Чебышева, имеющую вид (202)
где
В итоге значение t определяется с помощью выражения (204)
Доверительный интервал применительно к значению средней
Если брать значение любого статистического показателя, то для определения его доверительного интервала можно использовать следующий подход. В соответствии с ним из исходной совокупности объемом N случайным образом (с помощью метода Монте-Карло) формируется некоторая I совокупность выборок объемом M, при этом M<N. Далее по каждой выборке находится значение рассматриваемого показателя (например, коэффициент A линейной парной корреляции rxyi),
где
Используя эти значения (вместо Такой же подход может использоваться для определения доверительного интервала и для других статистических показателей.
Заключение — до 5 мин.
Содержание и методические рекомендации: - обобщить наиболее важные, существенные вопросы лекции. - сформулировать общие выводы. - поставить задачи для самостоятельной работы. - ответить на вопросы студентов.
Дата добавления: 2014-01-14; Просмотров: 706; Нарушение авторских прав?; Мы поможем в написании вашей работы! |