КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Лекция 10. Множественная нелинейная регрессия
Иногда, при проведении анализа линейной модели, исследователь получает данные о ее неадекватности. В этом случае, его по-прежнему интересует зависимость между предикторными переменными и откликом, но для уточнения модели в ее уравнение добавляются некоторые нелинейные члены. Самым удобным способом оценивания параметров полученной регрессии является нелинейное оценивание. Нелинейное оценивание оставляет выбор характера зависимости за вами. Например, вы можете определить зависимую переменную как логарифмическую функцию от предикторной переменной, как степенную функцию, или как любую другую композицию элементарных функций от предикторов. Если нет каких-то дополнительных соображений о виде нелинейной зависимости, то математическая модель объекта в многофакторных задачах записывается в виде полинома некоторой степени (в зависимости от требуемой точности): Выбор степени полиномиального уравнения регрессии зависит также от числа экспериментальных значений, так как количество определяемых коэффициентов уравнения не должно превышать это число. Чаще всего применяется уравнение второго порядка вида: . Для определения коэффициентов такого уравнения применение метода наименьших квадратов приводит к решению достаточно большой системы линейных уравнений, поэтому применяются различные специализированные пакеты обработки информации. Пример. Имеются данные о деятельности крупнейших компаний США в 1996 г., а именно зависимость чистого дохода (y) от оборота капитала (x 1), использованного капитала (x 2) и численности служащих (x 3, тыс. чел.). Финансовые величины в млрд долларов США.
Сначала определяем параметры множественного линейного уравнения. В результате применения процедуры Регрессия \ Анализ данных получены следующие значения: b 0 = 1,622593; b 1 = 0,009165; b 2 = 0,06246; b 3 = –0,00295, т.е. уравнение имеет вид: y = 1,622593 + 0,009165 × x 1 + 0,06246 × x 2 – 0,00295 × x 3. Расчетные значения по этому уравнению приведены в соответствующем столбце таблицы. Статистические характеристики. Общая сумма квадратов: . Остаточная сумма квадратов: . Факторная: . Факторная дисперсия на одну степень свободы s 2факт = 26,928/3 = 8,976. Остаточная дисперсия на одну степень свободы s 2ост и вытекающая из нее стандартная ошибка s ост: . Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F -отношения, т.е. критерий F: . Табличное значение критерия Фишера при уровне значимости 0,05 и числах степеней свободы 3 и 16 равно 3,239, следовательно полученное уравнение адекватно. Индекс множественной корреляции: . Коэффициент детерминации: . Критерий Фишера по формуле (3.32): . Величина скорректированного индекса детерминации . Средняя ошибка аппроксимации A = (38,37 / 20) × 100 = 191,8 %. Или: . Теперь переходим к нелинейному уравнению множественной регрессии, в качестве которого выбираем полный полином второго порядка: Для определения коэффициентов такого уравнения средствами Excel необходимо дополнительно сформировать 6 столбцов для расчета коэффициентов от b 11 до b 23. После этого применяем процедуру Регрессия \ Анализ данных. Результаты в следующей таблице:
Расчетные значения по этому уравнению приведены в соответствующем столбце таблицы. Статистические характеристики. Общая сумма квадратов: . Остаточная сумма квадратов: . Факторная: . Факторная дисперсия на одну степень свободы s факт = 37,495/9 = 4,166. Остаточная дисперсия на одну степень свободы s 2ост и вытекающая из нее стандартная ошибка s ост: . Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F -отношения, т.е. критерий F: . Табличное значение критерия Фишера при уровне значимости 0,05 и числах степеней свободы 9 и 10 равно 3,02, следовательно, полученное уравнение неадекватно. Индекс множественной корреляции: . Коэффициент детерминации: . Критерий Фишера по формуле (3.32): . Величина скорректированного индекса детерминации . Средняя ошибка аппроксимации A = (17,62 / 20) × 100 = 88,11 %. Или: . Для полученных уравнений 1-го и 2-го порядков можно подсчитать все статистические характеристики, как в примере для линейной множественной регрессии: частный F -критерий, ошибки в определении коэффициентов и значения критериев Стьюдента для каждого из них, уравнение регрессии в стандартизованном масштабе и его статистические характеристики. Большинство этих значений получаются в процедуре Регрессия.
Дата добавления: 2014-01-07; Просмотров: 4007; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |