Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляция

Тема 2. Корреляционный и регрессионный анализ

В экспериментальных исследованиях одной из важных задач является анализ зависимостей между изучаемыми переменными. Зависимость может быть либо функциональной, либо стохастической (вероятностной). При функциональной зависимости величины и связаны точной математической формулой, например, .

Для оценки тесноты и направления связи между изучаемыми переменными и при их стохастической зависимости служит линейный коэффициент корреляции . Он характеризует степень тесноты не всякой, а только линейной зависимости. При нелинейной зависимости между явлениями применяют так называемое корреляционное отношение.

Пусть две случайные величины и распределены по нормальному закону и имеется пар измеренных в опытах значений: . О наличии связи между и судят по выборочному парному коэффициенту корреляции .

В теории разработаны несколько модификаций формул для расчета линейного коэффициента корреляции. Одна из формул:

, (1)

где и - среднеквадратичные отклонения соответственно для массивов (выборок) и (в программе «Анализ данных» режим «Описательная статистика» и - стандартные отклонения);

; ,

и - средние значения соответственно в массивах и .

Величина изменяется в пределах: . Если , то и статистически независимы. Если , то между и имеется идеальная функциональная зависимость, т.е. на графике точки лежат на одной прямой линии ().

В общем случае, когда величины и связаны произвольной вероятностной зависимостью, принимает значения в пределах . Качественная оценка тесноты связи величин и может быть выявлена на основании следующей шкалы:

Теснота связи Значение при наличии
прямой связи обратной связи
слабая 0,1 – 0,3 (-0,1) – (-0,3)
умеренная 0,3 – 0,5 (-0,3) – (-0,5)
заметная 0,5 – 0,7 (-0,5) – (-0,7)
высокая 0,7 – 0,9 (-0,7) – (-0,9)
весьма высокая 0,9 – 0,99 (-0,9) – (-0,99)

 

Числовой пример. Имеются данные Госкомитета РФ за 1995 г (см. табл.).

№ п/п Область Уровень образования Отношение числа безработных к числу вакансий Уровень преступности
  Брянская   22,3  
  Владимирская   10,8  
  Ивановская   52,9  
  Калужская   2,2  
  Костромская   10,4  
  г. Москва   0,4  
  Московская   2,4  
  Нижегородская   5,4  
  Орловская   4,1  
  Рязанская   4,1  
  Смоленская   1,0  
  Тверская   4,2  
  Тульская   2,1  
  Ярославская   25,1    

Уровень образования - это число лиц со среднеспециальным и высшим образованием на 1000 жителей.

Уровень преступности - это число преступлений на 100 000 жителей.

Результаты расчетов в виде таблицы коэффициентов парной корреляции , вычисленных в программе «Анализ данных» режим «Корреляция» приведены в таблице.

 
     
-0,26    
-0,66 0,24  

 

Анализ расчетов:

- связь - является заметной и обратной (), т.е. с возрастанием уменьшается;

- связь - является слабой и прямой (), т.е. с увеличением увеличивается .

Поскольку выборочный коэффициент корреляции определен по ограниченной выборке, то необходимо проверить его значимость, т.е. установить достаточна ли величина для обоснованного вывода о наличии корреляционной связи. Оценку значимости выполняют по величине -критерия Стьюдента

. (2)

Здесь - табличное значений -распределения Стьюдента при уровне значимости и числе степеней свободы . Причем значение используется для двусторонней критической области.

Если условие (2) выполняется, то считается, что между переменными и имеется статистически значимая корреляционная связь.

Для нашего примера: ; ; .

Для переменных - :

.

Связь статистически значимая.

Для переменных - :

.

Связь статистически не значимая.

В Excel коэффициент определяет статистическая функция СТЬЮДРАСПОБР. Для нашего примера обращение к этой функции имеет вид =СТЬЮДРАСПОБР (0,05;12). Отметим, что эта функция дает значение для двусторонней критической области.

<== предыдущая лекция | следующая лекция ==>
Монтаж высотных сооружений | Парная линейная регрессия. Метод наименьших квадратов
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 379; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.