Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Парный корреляционный анализ

Упрощенная схема парного корреляционно-регрессионного анализа:

 

           
   
     
Близость распределения к нормальному закону распределения вероятностей (N (1;0))

 


да да да

                           
     
       
 
       
 
 

 


регрессионный анализ
нет нет нет

 

 

 
 

 


Парный корреляционный анализ заключается в вычислении подходящего показателя тесноты связи в зависимости от исходной информации. Полученный результат расчетов обычно сравнивают со шкалой Чеддока, которая позволяет сделать вывод о степени зависимости между изучаемыми признаками:

Шкала Чеддока:

 

Значение коэффициента корреляции 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика тесноты связи Слабая умеренная Заметная высокая весьма высокая

 

I. Параметрические показатели тесноты связи: если есть возможность провести регрессионный анализ, то для оценки тесноты связи вычисляются параметрические показатели (коэффициенты (см. блок-схему)). К ним относятся:

1. Линейный коэффициент корреляции:

– факторный признак

– результативный признак

– число наблюдений

Значения всегда (-1;+1)

Если значение :

¾ – прямая

¾ – обратная

¾ и – сильная

¾ – слабая

Этот коэффициент применяется, если в регрессионном анализе была выявлена прямолинейная зависимость между и .

2. Корреляционное отношение:

3. Индекс корреляции:

(0;+1)

Они применяются, если в регрессионном анализе выявлена криволинейная зависимость между и . Для вычисления данных показателей рассчитываются предварительно 3 вида количественной дисперсии:

1. – отражает вариацию результативного признака за счет действия факторного признака ;

2. – отражает вариацию за счет всех факторов кроме .

3. – отражает вариацию за счет действия всех факторов.

II. Непараметрические показатели тесноты связи: показатели данной группы вычисляют для количественной оценки тесноты связи. Если нет возможности применить регрессионный анализ.

1. Коэффициент Фехнера (самый простой):

(–1;+1)

Его вычисляют для двух количественных признаков: – это сумма совпадающих знаков в отклонениях от средних по рядам, – это сумма несовпадающих знаков в отклонениях от средних по рядам.

№ п/п
. .     + – + – . . + – – + . . . . . .

и – значение признаков у каждой единицы наблюдения

2. Коэффициент ассоциации Юла: применяются для оценки тесноты связи между двумя альтернативными признаками:

(–1;+1)

Да Нет
Да
Нет

– соответствующие поля «матрицы четырех полей»

3. Коэффициент контингенции Пирсона вычисляется вместо коэффициента ассоциации в случае, когда одно из полей матрицы равно 0. Дает более осторожную оценку тесноте связи (как правило, на 1/3 всегда меньше , т.к. если в матрице одно из полей равно 0, либо +, либо –).

(–1;+1)

 

Коэффициенты взаимной сопряженности:

4. Пирсона:

(0;+1)

 

5. Чупрова: учитывает, на сколько

групп разбит каждый из признаков

(более предпочтителен).

(0;+1)

 

Вычисляются в случае, если каждый из признаков и разбит на 2 группы и более (признаки могут быть как качественными, так и количественными). По данным коэффициентам можно сделать вывод только о тесноте связи, о направлении связи – нельзя.

и – число групп по каждому из признаков

Методика расчета :

Группа по признаку Группа признаков
     
+     +     = S =   * +
    +     +     = S =   * +
    +     +     = S =   * =
Итого        

– частоты (3 х 3)

¾ в клетках под каждой частотой записываем ее квадрат;

¾ полученный результат делим на итог частот данного столбца;

¾ суммируем полученные значения в строчках и результат записываем в первом итоговом столбце;

¾ полученные значения делим на сумму частот данной строки, и результат записываем во второй итоговый столбец;

¾ суммируем полученные значения * - это величина и есть .

Ранговый коэффициент корреляции (или коэффициент корреляции рангов):

6. К. Спирмэна

(–1;+1)

– ранговая разность

– число наблюдений (единиц совокупности).


7. М. Кендалла

(–1;+1)

 

Методика Спирмэна:

1. Ранжируем единицы наблюдения по признаку (ранжирование – это перегруппировка исходных данных – расположение единиц наблюдения в порядке возрастания или убывания значений):

№ п/п
. . . . . .

Формируем новую таблицу по – по возрастанию:

№ п/п
  13,8 13,9 13,9 14,2 14,4 … …. 1,8 1,9 2,2 1,9 2,6 … … 2,5 2,5 … … 2,5 2,5 … …    

2. Проставляем ранги сначала для , затем для : ранг – это порядковый номер варианта в упорядоченной совокупности. Связанные ранг – 13,9 и 13,9, сл., . Ранги хороши тем, что нет единиц измерения;

3. Предварительные выводы:

¾ если с ростом ранга возрастает ранг , то связь есть – она прямая;

¾ Если с ростом ранга уменьшается ранг , связь есть – она обратная;

¾ если с ростом ранга невозможно отследить закономерность изменения ранга , то связь либо отсутствует вообще, либо настолько слаба, что нет смысла ее оценивать.

4. вычисляем ранговую разность и ее квадрат ;

5. подстановка в формулу + выводы из 3 частей: есть/нет, прямая/обратная, сильная/слабая).

В некоторых случаях вычисляются другие непараметрические показатели, например, коэффициент канкордации, песериальный коэффициент корреляции.

4.2. Парный регрессионный анализ.

Наряду с оценкой направления и тесноты связи, статистика выражает аналитически взаимосвязь между факторным и результативным признаками с помощью уравнения регрессии, которое показывает форму связи между и и имеет вид математической функции.

Наиболее распространенные функции для выражения формы связи:

(уравнение прямой (линейная))

(парабола второго порядка)

(гипербола)

(показательная)

(степенная)

Если выбрана линейная функция: – показывает, на сколько единиц изменяется результативный признак , при увеличении факторного признака на единицу.

Если – то связь прямая

– то связь обратная

Если имеет положительное значение, то связь прямая, если отрицательное значение, то связь обратная.

Этапы построения уравнения парной регрессии:

1. Проверка однородности совокупности по каждому из признаков, а также близости распределений каждого из признаков к нормальному закону распределения вероятностей.

2. Строится график корреляционного поля – исходные данные переносим на график:

2.1. оценка наличия направления связи:

связь есть и она прямая

 

 

       
 
 
   

 


связь есть и она обратная

 

 

 
 


связь либо отсутствует, либо настолько слаба, что нет смысла ее оценивать

 

 

 
 


2.2. выявление и исключение (выбраковка) аномальных единиц наблюдения (значения).

       
 
   
 


фактические значения

аномальные значения

теоретические значения

 

доверительный интервал

       
   
 
 

 


Рис. 1. Корреляционное поле.

 

2.3. подбор математической функции по характеру концентрации единиц на корреляционном поле. Например, можно предположить, что наблюдается линейная зависимость между и .

3. Если и имеют разные единицы измерения, то необходима стандартизация, т.е. пересчет по каждому из признаков в стандартизованный масштаб:

№ п/п , , руб.
5* .            
Итого

* – такое-то (единица) наблюдение исключено из общего анализа, т.к. считается аномальной.

По каждому признаку необходимо рассчитать среднее значение и среднее квадратическое отклонение.

4. Составление системы нормальных уравнений:

 

Для уравнения прямой:

 

 

 

5. Промежуточные расчеты.

6. Вычисление параметров уравнения с точностью до 3, 4 знаков после запятой:

(в нашем примере: увеличение на 1 вызывает рост на 5 тыс. 348,2 руб.)

7. Расчет теоретических значений результативного признака .

8. Проверка правильности расчетов: (допускается небольшое отклонение).

9. Для подтверждения значимости построенного уравнения вычисляем соответствующий параметрический показатель тесноты связи (– индекс корреляции) и делаем выводы.

10. Оценка уравнений регрессии:

10.1. визуальная оценка: переносим теоретические значения результативного признака на график корреляционного поля и визуально определяем, насколько удачно выбранная функция описала сложившуюся взаимосвязь между и .

10.2. математическая оценка – это проверка точности (достоверности) уравнения регрессии: есть разные критерии:

10.2.1. остаточное средне квадратическое отклонение теоретических значений от фактических:

 

10.2.2. средняя ошибка аппроксимации:

 

Чем меньше значение, тем лучше (тем точнее уравнение регрессии, тем точнее описывает взаимосвязь).

11. интерпретация результатов (выводы).

 

<== предыдущая лекция | следующая лекция ==>
Индексы с постоянными и переменными весами с постоянной и переменной базой сравнения | Вступление
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 1400; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.