Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Этапы корреляционного анализа




 

Практическая реализация корреляционного анализа включает следующие этапы:

 

а) постановка задачи и выбор признаков;

б) сбор информации и ее первичная обработка (группировки, исключение аномальных наблюдений, проверка нормальности одномерного распределения);

в) предварительная характеристика взаимосвязей (аналитические группировки, графики);

г) устранение мультиколлинеарности (взаимозависимости факторов) и уточнение набора показателей путем расчета парных коэффициентов корреляции;

д) исследование факторной зависимости и проверка ее значимости;

е) оценка результатов анализа и подготовка рекомендаций по их практическому использованию

10. Аналитические показатели оценки степени тесноты статистических взаимосвязей (линейный коэффициент корреляции, индекс детерминации, корреляционное отношение)

 

Линейный коэффициен корреляции служит для определения степени тесноты парной линейной зависимости. Вычисляется по формуле:

Ковариа́ция (корреляционный момент, ковариационный момент) в теории вероятностей и математической статистике мера линейной зависимости двух случайных величин.

 

 

 

;

· во-первых, наличие связи между двумя потоками данных

· во-вторых, силу этой связи (сила связи определяется приближением абсолютного значения ЛКК к единице)

· в-третьих, направление этой связи (прямая – ЛКК больше единицы или обратная – ЛКК меньше единицы).

 

Коэффициент (индекс) детерминации (d) Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0≤ R2 ≤1. Коэффициент детерминации R2 показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между (у) и (x) коэффициент детерминации R2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества (точности) уравнения регрессии:

 

Корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < η < 0.3: слабая;

0.3 < η < 0.5: умеренная;

0.5 < η < 0.7: заметная;

0.7 < η < 0.9: высокая;

0.9 < η < 1: весьма высокая;

η = 1: функциональная

 

11. Количественное выражение статистических взаимосвязей путем построения уравнений регрессии. Понятие регрессии, различные виды уравнений регрессии.

РЕГРЕССИЯ [regression] — зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин (в последнем случае — имеем множественную Р.). Следовательно, при регрессионной связи одному и тому же значению x величины X (в отличие от функциональной связи) могут соответствовать разные случайные значения величины Y. Распределение этих значений называется условным распределением Y при данном X = x.

Уравнение, связывающее эти величины, называется уравнением Р., а соответствующий график — линией Р. величины Y по X. Уравнение Р. (в линейной форме) для одного фактора (“объясняющей” переменной):

 

Y = a0 + a1x.

Здесь a0, a1 — параметры, которые оцениваются из статистических данных. Они называются коэффициентами регрессии.

 

В зависимости от того, сколько различных факторов (показа­телей) связаны этой зависимостью, разделяют уравнения парной и множественной регрессии.

Уравнение парной регрессии выражает связь между двумя признаками (или показателями), один из которых (независимый) называется факторным, а второй (зависимый) ~ результативным.

Уравнение множественной регрессии выражает зависи­мость между более чем двумя показателями, один из которых назы­вается результативным (обозначается обычно через у, а остальные факторными: обозначаются х1 х2, х3...).

Уравнения парной регрессии могут иметь различный вид, в зависимости от того, какой функцией эта зависимость выражается (линейной, параболой и т.п.): Чаще всего используются следующие функции:

линейная ух= а0 + а1Х

полулогарифмическая ух = а0 + а1lgx;

показательная ух= а0 + а1x;

степенная ух = а0 хa1;

гиперболическая ух = а0 + а1 *(1/ x).

Для расчета параметров уравнений регрессии используется тот же метод наименьших квадратов, что и для расчета парамет­ров уравнений тренда, но его использование затруднено тем, что ввести условное обозначение переменной х в данном случае не удается.

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ — математический (математико-статистический) прием, служащий для выравнивания динамических рядов, выявления формы корреляционной связи между случайными величинами и др. Состоит в том, что функция, описывающая данное явление, аппроксимируется более простой функцией. Причем последняя подбирается с таким расчетом, чтобы среднеквадратичное отклонение (дисперсия) фактических уровней функции в наблюдаемых точках от выровненных было наименьшим.

Доделать

 

12. Аналитические показатели для оценки взаимосвязей между признаками, не измеримыми количественно (ранговый коэффициент корреляции, коэффициенты ассоциации и контингенции).

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).

2) Определить разности рангов каждой пары сопоставляемых значений.

3) Возвести в квадрат каждую разность и суммировать полученные результаты.

4) Вычислить коэффициент корреляции рангов по формуле:

- пример ранговой корреляции Спирмена




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 3984; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.018 сек.