Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Порядок вычисления коэффициента порядковой ранговой корреляции




Тема 2. Взаимосвязи социально-экономических явлений

В конечном итоге все без исключения науки в терминах общей теории познания занимаются установлением взаимосвязей между изучаемыми явлениями. Для этого в интструментариях предусмотрены определенные специфические процедуры. Располагает таковыми и статистика, так как изучение взаимосвязей социально-экономических явлений представляет собой пожалуй одну из главных ее задач. При этом важно отметить, что неформализованные подходы (на вербальном уровне) на основе понятий, суждений и умозаключений не являются альтернативными по отношению к формализованным средствам, но взаимно дополняют друг друга.

В общей теории статистики такие формализованные средства могут быть представлены в виде:

1. Четырехпольные и многопольные таблицы взаимной сопряженности.

2. Корреляционный анализ (данная разрабзультаты отка).

3. Аппарат парной и множественной регрессии (контрольное задание по парной регрессии на лето).

Таблицы сопряженности не представляют технических и методических трудностей и могут быть освоены слушателями самостоятельно. Но аппарат корреляционного анализа рассмотрим подробнее.

В отличие от функциональных связей существуют и «как бы» связи, то есть связи приблизительные, указывающие на наличие или отсутствие те или иных тенденций. Функциональные связи предполагают взаимно однозначное соответствие. Если существует конкретный вид функциональной зависимости, то конкретному значению аргумента соответствует конкретное значение (значения) функции. В отличие от функциональной связи вычисляются коэффициенты корреляции - линейной как в регрессионном анализе или парной ранговой (порядковой) корреляции – в данном случае.

Для того, чтобы вычислить данный коэффициент (коэффициенты) необходимы исходные данные, но именно в виде таблицы. Что и покажем на примере 1.

 

 

Пример 1. Пусть мы располагаем двумя статистическими показателями СП1 и СП2, которые представлены в виде небольших статистических совокупностей одинаковой мощности (это существенно). Пусть наш модельный пример будет таким.

Проблема: мы хотим знать, есть ли связь между посещаемостью и успеваемостью слушателей заочного отделения по специальности «Менеджмент организаций» по учебной дисциплине «Статистика». В порядке вычислительного эксперимента отберем 6 слушателей. Данные о их посещаемости в период сессии взяты из журнала преподавателя, результаты дифференцированного зачета взяты из экзаменационной ведомости и сведены в табл. 1. Поскольку таблица представляет собой матрицу размером (5 х 2), m строк уже пронумерованы, пронумеруем и n столбцов: их всего два. Следовательно, возможно вычисление только одного коэффициента - ρ12. Вот если бы было три статпоказателя, а не два, то можно было бы вычислить уже три коэффициента: первый со вторым, первый с третьим и второй с третьим. Всего число таких коэффициентов z при проведении корреляционного анализа можно вычислить (где n – число исследуемых статистических показателей):

n ∙ (n - 1)

z = ————.

 

 

Таблица 1

Исследуемые статистические

совокупности

 

Нумерация слушателей (пар данных) I Число пропусков занятий СП1 j=1 Оценки дифф.зачета   СП2 j=2 = n
5 = m    

 

Прежде чем приступать к вычислению коэффициента парной ранговой корреляции, попытаемся сначала оценить картину на умозрительном уровне и убедимся, что это далеко не просто. Так, согласно табл. 1, слушатели, пропустившие 0 занятий и 1 занятие получает «хорошо», тогда как среди непропустивших занятия есть и «хорошо» и «удовлетворительно». Поэтому наши суждения нуждаются в некоторой объективизации, и лучше всего этого достичь таким формализованным средством, как коэффициент парной ранговой корреляции, общий вид которого приведен в формуле (1).

В формуле (1) вычисляется корреляция между статпоказателями СП1 (j=1) - пропуски занятий и СП2 (j=2) – сессионная успеваемость. А в силу того, что коэффициент корреляции – это всегда что-то с чем-то, поэтому сокращенно и компактно записывается ρjk. В данном случае j=1, k=2, поэтому для данного случая ρjk = ρ12.

После того, как уточнили с индексами j и k, рассмотрим подробнее сущность переменных, входящих в формулу (1).

 

— · (m2 – 1) - (Tj + Tk) - ∑ (Sij - Sik)2

m

ρjk = ────────────────────────────────. (1)

6 6

((— · (m2 – 1) - 2Tj) · ((— · (m2 – 1) - 2Tk)) 1\2

m m

 

В формуле m – число пар исследуемых параметров (или мощность обоих множеств); Т – поправки на группы связанных рангов; S – это та же информация табл. 1, но выраженная в рангах (их еще надо получить). Дело в том, что исходная информация табл. 1 выражена в абсолютных единицах (в количественной шкале Сij), ее надо отобразить в ранговую, то есть построить отображение:

 

τ: Сij → Sij.

 

Поскольку операция отображения из количественной шкалы в порядковую (ранговую) является ответственным шагом, повторим содержание табл. 1 и виде табл. 2.

Ранги расставляются в пределах каждой совокупности (столбца) и делается этот так. Максимальному элементу присваивается 1 ранг. В СП1 это 3 пропуска (записано через косую черточку). Двум пропускам соответствует ранг 2, одному пропуску – ранг 3.

 

Таблица 2

Отображение τ. Расстановка рангов

и поправок на связанные ранги

Нумерация слушателей (пар данных) I Число пропусков занятий СП1 j=1 Сij / Sij Оценки дифф.зачета   СП2 j=2 = n Cij / Sij
5 = m 1 / 3 3 / 1 0 / 4,5 0 / 4,5 2 / 2 4 / 4 3 / 1,5 4 / 4 3 / 1,5 3 / 4
TWj TW1 = 6 TW2 = 30
Tj T1 = 0,5 T2 = 2,5

 

Сложнее с отсутствием пропусков: они у двух слушателей под номерами i=3 и i=4, которые занимают оставшиеся 4-е и 5-е места. А их, этих нулей, целых два, и на них приходится в сумме 4 + 5 = 9 мест. Если поровну, то полученную сумму нужно разделить на 2, в результате чего на оба нуля будет приходиться по 4,5 балла.

Теперь проведем ранжируование элементов совокупности СП2. Первые два места 1 + 2 = 3 приходится на две четверки, значит на каждую из них – по (3 / 2) = 1,5. На остальные три тройки приходятся 3, 4 и 5-е места. В сумме – 3 + 4 + 5 = 12. А их три, значит каждой тройке соответствует (12 / 3) = 4 ранг. Отображение данных из количественной шкалы в шкалу ранговую завершено.

Теперь необходимо научиться вычислять правки к группам связанных рангов для каждого столбика отдельно (две последние строки табл. 2): TWj – для вычисления коэффициента конкордации (в данной работе не требуется); Tj – для вычисления коэффициента парной ранговой корреляции.

TWj

Tj = ———.

То есть вычислим значения для предпоследней строки, разделим на 12 и найдем Т с соответствующим индексом (здесь – 1 или 2).

 

TWj = ∑ (t3 - t). (2)

ν=1

 

В формуле (2) lν (эль-ню) – число групп связанных рангов в ранжируемой совокупности; ν – текущая переменная; t – число одинаковых значений в группе.

Для первого столбика данных:

 

TW1 = (t3 - t) = (23 – 2) для 0 = 8 – 2 = 6;

T1 = ——— = 0,5 – записываем в последнюю строку табл. 2.

Теперь рассчитаем поправки на связанные ранги для второй статистической совокупности:

 

TW2 = (t3 - t) = (23 – 2) для 4 + (33 - 3) для 3 = (27 – 3) + (8 – 2) = 24 +6 = 30;

T2 = ——— = 2,5 – также записываем в последнюю строку табл. 2.

Необходимо также определиться с комплексом (m = 5):

6 6 6

— · (m2 – 1) = — (52 – 1) = — (25 - 1) = 20.

m 5 5

 

И, наконец, для вычисления искомого коэффициента по формуле (1) необходимо определить значение суммы

 

m

∑ (Si1 - Si2)2. (3)

i=1

 

Для определения выражения (3) необходимо составить рабочую таблицу (табл. 3).

 

Таблица 3

Рабочая таблица для вычисления суммы (3)

 

Номера элементов i   Si1   Si2   (Si1 - Si2)   (Si1 - Si2)2
  4,5 4,5 1,5 1,5 1,5 - 3 0.5 - 2 2,25 0,25
  ∑(Si1 - Si2)2.=24,5

 

Теперь можно непосредственно приступить к вычислению коэффициента парной ранговой корреляции для установления возможной связи посещаемости с успеваемостью по формуле (2):

— · (m2 – 1) - (T1 + T2) - ∑ (Si1 - Si2)2

m

ρ12 = ──────────────────────────────── =

6 6

((— · (m2 – 1) - 2T1) · ((— · (m2 – 1) - 2T2)) 1\2

m m

 

, 20 – (0,5 + 2,5) – 24,5 20 – 3,0 – 24,5 - 7,5

= ─────────────────── = —————— = —— = - 0,44.

[(20 – 2 ∙ 0,5) ∙ (20 – 2 ∙ 2,5)] 1/2 [19 ∙ 15]1/2 16,8

 

Итак, коэффициент парной ранговой корреляции на предмет установления возможной статистической связи успеваемости с посещаемостью нами наконец-то найден. Теперь остается не менее главный этап – этап интерпретации полученных результатов (или результата: ведь нами за несколько страниц получен всего-лишь одно-единственное число = - 0,44).

 




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 408; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.