Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения




Установление наличия и характера связи между признаками Валовый доход и Расходы на продукты питания методами аналитической группировки и корреляционной таблицы

А) Применение метода аналитической группировки

При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную таблицу 1.3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Валовый доходи результативным признаком Y –Расходы на продукты питания. Макет аналитической таблицы имеет следующий вид (табл. 2.7):

Таблица 2.7

Зависимость суммы расходов домохозяйств от объема валового дохода

Номер группы Группы домохозяйств по объему валового дохода, Тыс. руб. Число домохозяйств Расходы на продукты питания, Тыс. руб.
всего в среднем на одно домохозяйство
        5=4/3
         
         
         
         
         
Итого        

Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 2.8.

Таблица 2.8

Зависимость суммы расходов домохозяйств от объема валового дохода

Номер группы Группы домохозяйств по объему валового дохода, Тыс. руб. Число домохозяйств Расходы на продукты питания, Тыс. руб.
всего в среднем на одно домохозяйство
        5=4/3
  22,1-76,1   59,7 14,925
  76,1-130,1   264,5 37,78571429
  130,1-184,1   614,6 55,87272727
  184,1-238,1   395,2 79,04
  238,1-292,1   304,2 101,4
Итого х   1638,2 х

Вывод. Анализ данных табл. 2.8 показывает, что с увеличением объема валового дохода от группы к группе систематически возрастает и средний расход по каждой группе домохозяйств, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

Б) Применение метода корреляционной таблицы.

Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j -ой строки и k -ой графы указывается число единиц совокупности, входящих в j -ый интервал по факторному признаку и в k -ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.

Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – Валовый доход известны из табл. 2.8. Для результативного признака Y – Расходы на продукты питания величина интервала определяется по формуле (1) при k = 5, уma x = 110,2 тыс. руб., уmin = 10,2 тыс.руб.:

Границы интервалов ряда распределения результативного признака Y имеют следующий вид (табл. 2.9):

Таблица 2.9

Номер группы Нижняя граница, Тыс. руб. Верхняя граница, Тыс. руб.
  10,2 30,2
  30,2 50,2
  50,2 70,2
  70,2 90,2
  90,2 110,2

Подсчитывая с использованием принципа полуоткрытого интервала

[) число банков, входящих в каждую группу (частоты групп), получаем интервальный ряд распределения результативного признака (табл. 2.10).

Таблица 2.10

Распределение банков по сумме прибыли

Группы домохозяйств по валовому доходу, тыс. руб., х Число домохозяйств, fj
10,2-30,2  
30,2-50,2  
50,2-70,2  
70,2-90,2  
90,2-110,2  
Итого  

Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 2.11).

Таблица 2.11

Корреляционная таблица зависимости суммы прибыли банков

от объема кредитных вложений

Группы домохозяйств по валовому доходу, тыс. руб., Расходы на продукты питания, тыс. руб.  
10,2-30,2 30,2-50,2 50,2-70,2 70,2-90,2 90,2-110,2 ИТОГО
22,1-76,1            
76,1-130,1            
130,1-184,1            
184,1-238,1            
238,1-292,1            
Итого            
               

Вывод. Анализ данных табл. 2.11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между Валовым доходом и суммой расходов домохозяйств.

Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .

Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле:

, (9)

где – общая дисперсия признака Y,

– межгрупповая (факторная) дисперсия признака Y.

Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство = 0, а при наличии функциональной связи между ними - равенство = 1.

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле

, (10)

где yi – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:

(11)

или как средняя взвешенная по частоте групп интервального ряда:

(12)

Для вычисления удобно использовать формулу (11), т.к. в табл. 2.8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет по формуле (11):

Для расчета общей дисперсии применяется вспомогательная таблица 2.12.

Таблица 2.12

Вспомогательная таблица для расчета общей дисперсии

Номер домохозяйства п/п Расходы, тыс. руб.  
         
  14,9 -39,706666 1576,619 222,01
  22,2 -32,406666 1050,192 492,84
  10,2 -44,406666 1971,952 104,04
  12,4 -42,206666 1781,403 153,76
  32,2 -22,406666 502,0587 1036,84
  33,2 -21,406666 458,2453 1102,24
  36,8 -17,806666 317,0774 1354,24
  34,8 -19,806666 392,304 1211,04
  50,4 -4,206666 17,69604 2540,16
  48,6 -6,006666 36,08004 2361,96
  44,4 -10,206666 104,176 1971,36
    -8,606666 74,0747  
  34,2 -20,406666 416,432 1169,64
  61,5 6,893334 47,51805 3782,25
  55,8 1,193334 1,424046 3113,64
  61,5 6,893334 47,51805 3782,25
  69,6 14,993334 224,8001 4844,16
  59,7 5,093334 25,94205 3564,09
  53,1 -1,506666 2,270042 2819,61
  57,9 3,293334 10,84605 3352,41
  40,2 -14,406666 207,552 1616,04
    25,393334 644,8214  
  81,2 26,593334 707,2054 6593,44
  74,4 19,793334 391,7761 5535,36
  59,2 4,593334 21,09872 3504,64
    35,393334 1252,688  
    50,393334 2539,488  
    34,393334 1182,901  
  110,2 55,593334 3090,619 12144,04
  69,6 14,993334 224,8001 4844,16
Итого 1638,2   19321,58 108778,2

Расчет общей дисперсии по формуле (10):

Общая дисперсия может быть также рассчитана по формуле:

, где – средняя из квадратов значений результативного признака,

– квадрат средней величины значений результативного признака.

Для демонстрационного примера

Тогда

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле

, (13)

где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета межгрупповой дисперсии строится вспомогательная таблица 2.13, при этом используются групповые средние значения из табл. 2.8 (графа 5).

Таблица 2.13

Вспомогательная таблица для расчета межгрупповой дисперсии

Группы домохозяйств по размеру валового дохода, Тыс. руб. Число домохозяйств, Среднее значение в группе
         
22,1-76,1   14,925 -39,6817 6298,538
76,1-130,1   37,78571429 -16,821 1980,611
130,1-184,1   55,87272727 1,266061 17,63202
184,1-238,1   79,04 24,43333 2984,939
238,1-292,1   101,4 46,79333 6568,848
Итого   х х 17850,57

Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического коэффициента детерминации по формуле (9):

или 92,39%

Вывод: 92,39% вариации суммы расходов домохозяйств обусловлено вариацией объема валового дохода, а 7,61% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле:

(14)

Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 2.14):

Таблица 2.14

Шкала Чэддока

h 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика силы связи Слабая Умеренная Заметная Тесная Весьма тесная

Расчет эмпирического корреляционного отношения по формуле (14):

или 96,12%

Вывод: Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является весьма тесной.


Задание 3

По результатам выполнения Задания 1 с вероятностью 0,683 необходимо определить: ошибку выборки средней величины объема валового дохода домохозяйств и границы, в которых будет находиться генеральная средняя.

Решение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности домохозяйств районов границ, в которых будут находиться величина среднего объема кредитных вложений банков.




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 506; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.055 сек.