КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема лекции 11. Статистическое изучение взаимосвязи социально-экономических явлений
Конспект лекции: Как правило, вычисления в социально-экономических исследованиях проводятся на основе ограниченного числа данных, которые можно рассматривать как выборочные. Поэтому, естественно, возникает вопрос о вероятностной оценке полученных данных, а именно о значимости полученных результатов корреляционного и регрессионного анализа. Простейшей системой корреляционной связи является линейная связь между двумя признаками — парная линейная корреляция. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид: Уравнение парной линейной регрессии имеет вид: (36) где — среднее значение результативного признака у при определенном значении факторного признака х; а — свободный член уравнения; b — коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака (от его средней величины на одну единицу его измерения), — вариация у, приходящаяся на единицу вариации х. Параметры уравнения (36) рассчитываются методом наименьших квадратов (МНК) по данным о значениях признаков х и у в изучаемой совокупности, состоящей из n единиц. Исходное условие МНК для прямой линии имеет вид: (37) Для отыскания значений параметров а и b, при которых f(а, b) принимает минимальное значение, частные производные функции приравниваем нулю и преобразуем полученные уравнения, которые называются нормальными уравнениями МНК для прямой: (38) Отсюда система нормальных уравнений имеет вид: (39) Нормальные уравнения (МНК) для прямой линии регрессии являются системой двух уравнений с двумя неизвестными a и b. Все остальные величины, входящие в систему, определяются по исходной информации. Таким образом, оба параметра уравнения линейной регрессии однозначно вычисляются при решении этой системы уравнений. Если первое нормальное уравнение разделить на n, получим , откуда (40) По уравнению (35) обычно на практике вычисляется свободный член уравнения регрессии а. Параметр b — коэффициент регрессии вычисляется по преобразованной формуле, которую можно вывести, решая систему нормальных уравнений относительно b: (41) Так как знаменатель этого выражения есть не что иное, как дисперсия признака, т.е. ах, то можно записать формулу коэффициента регрессии в виде , или (42) где в числителе ковариация переменных. При оценке могут быть подвергнуты показатели тесноты связи изучаемых признаков, параметры полученного корреляционного уравнения, точность аппроксимации, индивидуальные значения теоретического уровня признака и, наконец, уравнение корреляции в целом. Оценка вышеперечисленных результатов корреляционного анализа производится с применением распределения Стьюдента и распределения Фишера - Снедекора. Рассмотрим статистическую оценку некоторых результатов корреляционного анализа для линейной зависимости. Значение коэффициента парной корреляции является случайной величиной, изменяющейся от выборки к выборке. Оценку «истинного» коэффициента корреляции в генеральной совокупности р, который характеризует «истинную» тесноту связи явлений в генеральной совокупности, можно произвести с помощью построения доверительного интервала: (43) где — среднеквадратическая ошибка выборочного парного коэффициента корреляции: (44) Здесь n — число наблюдений. Величина r (табличное значение) имеет распределение t- Стьюдента с числом степеней свободы, равным n - 2, уровень значимости а определяется как единица минус принятая величина вероятности. Если мы хотим определить значимость отличия r от р, то при уровне значимости а проверяем нулевую гипотезу Нo (о равенстве нулю р): р = 0. Для этого вычислим наблюдаемое значение критерия: (45) и сравним его с табличным. При этом если: ♦ - нет оснований отвергать нулевую гипотезу; ♦ - нулевую гипотезу отвергают. При небольшом числе наблюдений в выборке и при высоком коффициенте корреляции (> 0,9) для построения доверительного интервала и проверки значимости используют преобразование Фишера: (46) Наблюдаемое значение критерия определяют как (47) и сравнивают с теоретическим t та6л (интеграл вероятностей). Значимость полученной величины коэффициента регрессии а1 в выборочном теоретическом уравнении у проверяется аналогично значимости коэффициента корреляции r. Среднеквадратическая ошибка равна: (48) Для проверки нулевой гипотезы вычисляем наблюдаемое значение критерия: (49) и сравниваем с табличным распределением Стьюдента при избранном уровне значимости а. Доверительные интервалы для индивидуальных значений при принятой вероятности определяются так: (50) Графически приведенное выражение — это две симметричные прямые, параллельные линии регрессии. Остаточная дисперсия , т. е. та часть дисперсии зависимой переменной, которая не объясняется влиянием рассматриваемого фактора X определяется следующим образом: (51) где r 2 — коэффициент детерминации (показывает долю дисперсии у, объясняемую аргументом х). Остаточная дисперсия может быть также определена по формуле: (52) Проверку значимости найденной зависимости можно произвести с помощью распределения Фишера—Снедекора: (53) Полученное значение сравнивается с табличным при избранном уровне значимости и соответствующем числе степеней свободы (n -1-для большей дисперсии n -3- для меньшей дисперсии). Если оно окажется больше табличного, то гипотеза о том, что выравнивание по уравнению корреляции хуже, чем по уравнению , отвергается. Для оценки адекватности можно также воспользоваться показателем средней ошибки аппроксимации: (54) Исследователь сам задает величину средней ошибки. Обычно в социально-экономических исследованиях считается приемлемым . Конспект лекции: Основная литература 1 [ 320-391], 4 [ 98-110]. Контрольные вопросы: 1. Распределение t- Стьюдента. 2. Проверка нулевой гипотезы. 3. Доверительные интервалы для индивидуальных значений 4. Формула остаточной дисперсии 5. Показатели средней ошибки аппроксимации:
Дата добавления: 2014-12-23; Просмотров: 415; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |