КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Й учебный вопрос. Множественная линейная регрессия
ТЕКСТ ЛЕКЦИИ. Введение — до 5 мин. Содержание и методические рекомендации: - довести установку занятия через рассматриваемые учебные вопросы; - охарактеризовать место и значение данной темы в курсе; - описать обстановку, в которой разрабатывалась теоретическая проблема и шла ее практическая реализация. Основная часть — до 90 минут на обзор содержания, детальное изучение материала отводится на самостоятельную подготовку обучающегося. При множественном регрессионном анализе используется, как правило, уравнение линейной множественной регрессии (113)
где - оценка значения результирующего показателя , a0, a1 …am – параметры данного уравнения, значения которых являются неизвестными. Значения этих параметров находится с помощью метода наименьших квадратов, целевая функция которого имеет вид (114)
Функция является функцией для того, чтобы найти неизвестные значения параметров , необходимо функцию продифференцировать по переменным , а полученные соотношения приравнять нулю. В этом случае получаем соотношения (115)
Решая эту систему управлений, находятся неизвестные значения параметров . Перед тем, как определять значения параметров, необходимо оценивать коррелированность различных факторов между собой. Для этого берутся два отдельно взятых фактора, например . Для них находится значение коэффициента линейной парной корреляции . Если с помощью значения данного коэффициента мы приходим к выводу о некоррелированности факторов , то они оба остаются в уравнении линейной множественной регрессии. Если же мы приходим к выводу о наличии тесной связи между факторами , то один из этих факторов исключается из уравнения линейной множественной регрессии, а другой остается в этом уравнении. Для того, чтобы выбрать какой из факторов - - оставить в уравнении, а какой исключить, следует использовать следующий подход. В соответствии с ним определяются значения коэффициентов линейной парной корреляции между факторами и результирующим показателем. В том случае, если выполняется соотношение , то в уравнении остается фактор , а исключается фактор . В том случае, если выполняется соотношение , то в уравнении остается фактор ,а исключается фактор . В итоге попарно рассматриваются все факторы и находится k совокупность факторов, независимых между собой, при этом . По окончанию решения задачи, связанной с определением неизвестных значений параметров уравнения линейной множественной регрессии, можно найти значение коэффициента линейной парной корреляции , используя для этого формулу (116)
Формально по формуле (116) находится значение коэффициента линейной парной корреляции между результирующим показателем yn, , и его оценкой . По сути дела с помощью формулы находится значение коэффициента линейной множественной корреляции между результирующим показателем yn, , и всей совокупностью рассматриваемых факторов x1n, x2n, … xkn, . Это обусловлено тем, что оценка результирующего показателя , существенно зависит от полноты используемой совокупности факторов. Таким образом, если значение подтверждает тесную связь между результирующим показателем yn, , и его оценкой , можно говорить о полноте используемой исходной совокупности факторов. Одновременно, это свидетельствует о том, что задача, связанная с определением значений параметров уравнения линейной множественной регрессии, решена достаточно точно.
Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: 1) быть количественно измеримыми; 2) не должны быть коррелированны между собой и тем боле находиться в точной функциональной связи. Наличие между двумя факторами весьма тесной линейной связи (парный коэффициент корреляции rхх превышает по абсолютной величине 0,7) называется коллинеарностью, а между несколькими факторами — мультиколлинеарностью. Мультиколлинеарность – это нестрогая линейная зависимость между факторными признаками, которая приводит к следующим нежелательным последствиям: 1. Оценки параметров становятся ненадежными, они обнаруживают большие стандартные ошибки, малую значимость, в то же время модель является значимой, т.е. значение множественного коэффициента корреляции завышено; 2. Небольшое изменение исходных данных приводит к существенному изменению оценок параметров модели; 3. Оценки параметров модели имеют неправильные знаки или неоправданно большие значения, что делает модель непригодной для анализа и прогнозирования; 4. Становится невозможным определить изолированное влияние факторов на результативный показатель. В наибольшей степени ответственным за мультиколлинеарность будет тот признак, который теснее связан с другими факторами модели (он имеет высокие по модулю значения коэффициентов парной линейной корреляции). Поэтому, если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Пример. Проверим наличие мультиколлинеарности между факторами х1 (возраст, лет), х2 (стаж работы, лет), х3 (выработка шт./смену ), которые могут оказывать влияние на результативный признак - заработная плата. Для этого построим корреляционную матрицу. Из матрицы видно, что между признаками имеется довольно сильная линейная зависимость, т.к. . Вследствие этого требуется устранить один из факторов. Таблица 2.11
Из модели следует исключить фактор х2, т.к. он теснее связан с третьим фактором, чем фактор х1: . Как правило, прежде чем найти параметры уравнения множественной регрессии, определяют и анализируют парные коэффициенты корреляции: . При этом систему нормальных уравнений можно видоизменить таким образом, чтобы при вычислении параметров регрессии использовать уже найденные парные коэффициенты корреляции. Для этого в уравнении регрессии заменяют переменные у, х1, х2,..., xk переменными ti, полученными следующим образом: Эта процедура называется стандартизацией переменных. В результате осуществляется переход от натурального масштаба переменных хij к центрированным и нормированным отклонениям tij . В стандартизированном масштабе среднее значение признака равно 0, а среднее квадратическое отклонение равно 1, т.е. . При переходе к стандартизированному масштабу переменных уравнение множественной регрессии принимает вид: , где (j = 1, k) — стандартизированные коэффициенты регрессии.
-коэффициент характеризует изменение исследуемого показателя в зависимости от изменения одного фактора при постоянном уровне остальных. Иначе, -коэффициент показывает, на какую часть сигмы () изменилось бы значение результата, если бы соответствующий j -фактор изменился на сигму (), а прочие факторы не изменились бы. Кроме того, -коэффициенты позволяют оценить степень воздействия факторных признаков на результат. В силу того что все -коэффициенты выражены в одинаковых единицах измерения, то если 2 > 3, тогда фактор х2 сильнее влияет на результативный признак, чем фактор х3. К уравнению множественной регрессии в стандартизованном масштабе применяется МНК. -коэффициенты определяются из следующей системы уравнений: Связь коэффициентов множественной регрессии bi со стандартизованными коэффициентами описывается соотношением . Параметр а определяется как. В двухфакторном регрессионном анализе найти уравнение регрессии в стандартизированном масштабе можно через формулы: , . На основе линейного уравнения множественной регрессии: могут быть найдены частные уравнения регрессии: В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном среднем уровне. Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности: где bj – коэффициент регрессии при j- омфакторе; - частное уравнение регрессии.
Для того чтобы оценить сравнительную силу влияния факторов, по каждому фактору рассчитывают средние коэффициенты эластичности: , где — среднее значение j -го факторного признака; — среднее значение результативного признака; — коэффициент регрессии при j-м факторном признаке.
Расчет коэффициента эластичности дополняет экономический анализ. Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов. Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или оценивает тесноту совместного влияния на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции: где — общая дисперсия результативного признака; — остаточная дисперсия, характеризующая отклонения фактических уровней результативного признака yi отрассчитанных по уравнению множественной регрессии . При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением: Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции или совокупного коэффициента корреляции. При линейной форме связи расчет совокупного коэффициента корреляции можно также выполнить, используя парные коэффициенты корреляции: где b1, b2,..., bk — параметры уравнения множественной регрессии в натуральном масштабе. Наряду с измерением совместного влияния отобранных факторов на результативный признак важно определить воздействие каждого фактора при элиминировании его взаимосвязи с остальными (что возможно, когда последние зафиксированы на постоянном уровне). Для решения данной задачи при линейной связи применяют частные коэффициенты корреляции, а для нелинейной - частные индексы детерминации. В общем виде при наличии k факторов для уравнения: коэффициент частной корреляции, измеряющий влияние на у фактора хi при неизменном уровне других факторов, можно определить по формуле: , где - множественный коэффициент детерминации всего комплекса факторов с результатом; - тот же показатель детерминации, но без введения в модель фактора хk.
Дата добавления: 2014-01-14; Просмотров: 1492; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |