Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Тема лекции 11. Статистическое изучение взаимосвязи социально-экономических явлений




Конспект лекции: Как правило, вычисления в социально-экономических исследованиях проводятся на основе ограниченного числа данных, ко­торые можно рассматривать как выборочные. Поэтому, естественно, возникает вопрос о вероятностной оценке полученных данных, а именно о значимости полученных результатов корреляционного и регрессионного анали­за.

Простейшей системой корреляционной связи является линейная связь между двумя признаками — парная линейная корреляция. Уравнение парной линейной корреляционной связи на­зывается уравнением парной регрессии и имеет вид:

Уравнение парной линейной регрессии имеет вид:

(36)

где — среднее значение результативного признака у при определен­ном значении факторного признака х;

а — свободный член уравнения;

b — коэффициент регрессии, измеряющий среднее отношение от­клонения результативного признака от его средней величины к отклонению факторного признака (от его средней величины на одну единицу его измерения), — вариация у, приходящаяся на единицу вариации х.

Параметры уравнения (36) рассчитываются методом наи­меньших квадратов (МНК) по данным о значениях признаков х и у в изучаемой совокупности, состоящей из n единиц.

Исходное условие МНК для прямой линии имеет вид:

(37)

Для отыскания значений параметров а и b, при которых f(а, b) принимает минимальное значение, частные производ­ные функции приравниваем нулю и преобразуем полученные уравнения, которые называются нормальными уравнениями МНК для прямой:

(38)

Отсюда система нормальных уравнений имеет вид:

(39)

Нормальные уравнения (МНК) для прямой линии регрес­сии являются системой двух уравнений с двумя неизвестны­ми a и b. Все остальные величины, входящие в систему, оп­ределяются по исходной информации. Таким образом, оба параметра уравнения линейной регрессии однозначно вычис­ляются при решении этой системы уравнений.

Если первое нормальное уравнение разделить на n, полу­чим

, откуда (40)

По уравнению (35) обычно на практике вычисляется сво­бодный член уравнения регрессии а. Параметр b — коэффициент регрессии вычисляется по преобразованной формуле, которую можно вывести, решая систему нормальных уравнений относительно b:

(41)

Так как знаменатель этого выражения есть не что иное, как дисперсия признака, т.е. ах, то можно записать формулу коэффициента регрессии в виде

, или (42)

где в числителе ковариация переменных.

При оценке могут быть подвергнуты показатели тесноты связи изучаемых признаков, параметры полученного корреляционного уравнения, точ­ность аппроксимации, индивидуальные значения теоретического уровня признака и, наконец, уравнение корреляции в целом. Оценка вышепере­численных результатов корреляционного анализа производится с приме­нением распределения Стьюдента и распределения Фишера - Снедекора. Рассмотрим статистическую оценку некоторых результатов корре­ляционного анализа для линейной зависимости.

Значение коэффициента парной корреляции является случайной ве­личиной, изменяющейся от выборки к выборке. Оценку «истинного» коэффициента корреляции в генеральной совокупности р, который ха­рактеризует «истинную» тесноту связи явлений в генеральной сово­купности, можно произвести с помощью построения доверительного интервала:

(43)

где — среднеквадратическая ошибка выборочного парного коэффици­ента корреляции:

(44)

Здесь n — число наблюдений.

Величина r (табличное значение) имеет распределение t- Стьюдента с числом степеней свободы, равным n - 2, уровень значимости а опреде­ляется как единица минус принятая величина вероятности.

Если мы хотим определить значимость отличия r от р, то при уровне значимости а проверяем нулевую гипотезу Нo (о равенстве нулю р): р = 0. Для этого вычислим наблюдаемое значение критерия:

(45)

и сравним его с табличным. При этом если:

- нет оснований отвергать нулевую гипотезу;

- нулевую гипотезу отвергают.

При небольшом числе наблюдений в выборке и при высоком коффициенте корреляции (> 0,9) для построения доверительного интервала и проверки значимости используют преобразование Фишера:

(46)

Наблюдаемое значение критерия определяют как

(47)

и сравнивают с теоретическим t та6л (интеграл вероятностей).

Значимость полученной величины коэффициента регрессии а1 в выборочном теоретическом уравнении у проверяется аналогично зна­чимости коэффициента корреляции r. Среднеквадратическая ошибка равна:

(48)

Для проверки нулевой гипотезы вычисляем наблюдаемое значение критерия:

(49)

и сравниваем с табличным распределением Стьюдента при избранном уровне значимости а.

Доверительные интервалы для индивидуальных значений при при­нятой вероятности определяются так:

(50)

Графически приведенное выражение — это две симметричные пря­мые, параллельные линии регрессии.

Остаточная дисперсия , т. е. та часть дисперсии зависимой пере­менной, которая не объясняется влиянием рассматриваемого фактора X определяется следующим образом:

(51)

где r 2 — коэффициент детерминации (показывает долю дисперсии у, объясняемую аргументом х).

Остаточная дисперсия может быть также определена по формуле:

(52)

Проверку значимости найденной зависимости можно произвести с помощью распределения Фишера—Снедекора:

(53)

Полученное значение сравнивается с табличным при избранном уровне значимости и соответствующем числе степеней свободы (n -1-для большей дисперсии n -3- для меньшей дисперсии). Если оно окажется больше табличного, то гипотеза о том, что выравнивание по уравнению корреляции хуже, чем по уравнению , отвергается.

Для оценки адекватности можно также воспользоваться показателем средней ошибки аппроксимации:

(54)

Исследователь сам задает величину средней ошибки. Обычно в соци­ально-экономических исследованиях считается приемлемым .

Конспект лекции:

Основная литература 1 [ 320-391], 4 [ 98-110].

Контрольные вопросы:

1. Распределение t- Стьюдента.

2. Проверка нулевой гипотезы.

3. Доверительные интервалы для индивидуальных значений

4. Формула остаточной дисперсии

5. Показатели средней ошибки аппроксимации:




Поделиться с друзьями:


Дата добавления: 2014-12-23; Просмотров: 390; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.