Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Между явлениями

Тема 9. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ

УПРАЖНЕНИЯ

Задача 8.1. В районе А проживает 2500 семей. Для установления среднего числа детей в семье была проведена 2%-ная случайная бесповторная выборка семей, в результате чего были получены следующие данные.

Число детей             Всего
Число семей              

С вероятностью 0,997 определите границы, в которых находится среднее число детей в семье в генеральной совокупности (в районе А). Коэффициент доверия t=2,97.

 

Задача 8.2. На машиностроительном заводе с численностью рабочих 5000 чел. было проведено 4%-ное выборочное обследование квалификации рабочих методом случайного бесповторного отбора. В результате обследования получены следующие данные:

Квалификация рабочих (тарифный разряд)            
Число рабочих, чел.            

С вероятностью 0,997 определите пределы, в которых находится средний тарифный разряд рабочих завода. Коэффициент доверия t= 2,97.

 

Задача 8.3. Для изучения производительности труда токарей на машиностроительном заводе было проведено 10%-ное выборочное обследование 100 рабочих методом случайного бесповторного отбора. В результате обследования получены данные о часовой выработке рабочих.

Часовая выработка, шт. 18 – 20 20 – 22 22 – 24 24 – 26 26 – 28 28 – 30
Число рабочих, чел.            

С вероятностью 0,954 определите пределы, в которых находится средняя выработка одного токаря завода. Коэффициент доверия t=1,99.

 

Задача 8.4. На предприятии с числом рабочих 2000 чел. было проведено 2%-ное обследование возраста рабочих методом случайного бесповторного отбора. В результате обследования получены следующие данные.

Возраст рабочих, лет До 20 20 – 30 30 – 40 40 – 50 50 – 60 Старше 60
Число рабочих            

С вероятностью 0,990 определите пределы, в которых находится средний возраст рабочих предприятия. Коэффициент доверия t=2,58.

9.1. Причинность, регрессия, корреляция

В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Причинно-следственные отношения – это связь явлений и процессов, когда изменение одного из них – причины, ведет к изменению другого – следствия.

Признаки по их значению для изучения взаимосвязи делятся на два вида: факторные и результативные.

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

В основе первого этапа статистического изучения связи лежит качественный анализ изучаемого явления, т.е. исследование его природы методами экономической теории, социологии, конкретной экономики. Второй этап – построение модели связи. Третий, последний этап – интерпретация результатов, вновь связан с качественными особенностями изучаемого явления.

В статистике различают функциональную связь и стохастическую. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Такая связь проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

Связи между признаками и явлениями ввиду их большого разнообразия классифицируются по ряду оснований: по степени тесноты связи, направлению и аналитическому выражению.

Степень тесноты корреляционной связи количественно может быть оценена с помощью коэффициента корреляции, величина которого определяет характер связи (табл. 1).

 

 

Таблица 1 - Количественные критерии тесноты связи

Величина коэффициента корреляции Характер связи
До ½± 0,3½ Практически отсутствует
½± 0,3½ - ½± 0,5½ Слабая
½± 0,5½ - ½± 0,7½ Умеренная
½± 0,7½ - ½± 1,0½ Сильная

По направлению выделяют связь прямую и обратную.

При прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. В случае обратной связи с увеличением значений факторного признака значения результативного убывают, и наоборот.

По аналитическому выражению выделяют связи: прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной; если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы, показательной, экспоненциальной и т.п.), то такую связь называют нелинейной или криволинейной.

Для выявления наличия связи, ее характера и направления в статистике используются методы: приведения параллельных данных; аналитических группировок; статистических графиков; корреляции.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получит представление о ее характере. Например, изменение двух величин представлено следующими данными.

Х                  
У                  

Как видно, с увеличением величины Х величина У также возрастает. Поэтому связь между ними прямая, и описать ее можно уравнением прямой, либо уравнением параболы второго порядка.

График поля корреляции

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи (рис.).

 

 

При отсутствии тесных связей имеет место беспорядочное расположение точек на графике.

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака на него оказывают влияние многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер.

Корреляция – это статистическая взаимосвязь между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания (средней величины) другой.

В статистике принято различать следующие виды зависимостей.

1. Парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными).

2. Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

Задачей корреляционного анализа является количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаком (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Кроме того, величина коэффициента корреляции служит оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

9.2. Оценка тесноты связи

Теснота корреляционной связи между факторным и результативным признаками может исчисляться с помощью таких коэффициентов: эмпирический коэффициент корреляционной связи (коэффициент Фехнера); коэффициент ассоциации; коэффициент взаимной сопряженности Пирсона и Чупрова; коэффициент контингенции; ранговые коэффициенты корреляции Спирмэна и Кендэла; линейный коэффициент корреляции; корреляционное отношение и др.

Наиболее совершенно тесноту связи характеризует линейный коэффициент корреляции: , где – средняя из произведений значений признаков ху; – средние значения признаков х и у; - средние квадратические отклонения признаков х и у. Он используется в том случае, если связь между признаками линейная

Линейный коэффициент корреляции может быть положительным или отрицательным.

Положительная его величина свидетельствует о прямой связи, отрицательная – об обратной. Чем ближе к ±1, тем связь теснее. При функциональной связи между признаками = ±1. Близость к 0 означает, что связь между признаками слабая.

 

9.3. Методы регрессионного анализа

С понятием корреляции тесно связано понятие регрессии. Первая служит для оценки тесноты связи, вторая - исследует ее форму. Корреляционно-регрессионный анализ, как общее понятие, включает в себя измерение тесноты и направления связи (корреляционный анализ) и установление аналитического выражения (формы) связи (регрессионный анализ*).

После того, как с помощью корреляционного анализа выявлено наличие статистических связей между переменными и оценена степень их тесноты, переходят к математическому описанию конкретного вида зависимостей с использованием регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель у и аргументы х1, х2,… хk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров связи и анализируют свойства полученного уравнения.

Функция, описывающая зависимость среднего значения результативного признака у от заданных значений аргументов, называется функцией (уравнением) регрессии. Регрессия – линия, вид зависимости средней результативного признака от факторного.

Наиболее разработанной в теории статистики является методология парной корреляции, рассматривающая влияние вариации факторного признака х на результативный у

Уравнение прямолинейной корреляционной связи имеет вид: .

Параметры а0 и а1 называют параметрами уравнения регрессии.

Для определения параметров уравнения регрессии используется способ наименьших квадратов, который даёт систему двух нормальных уравнений:

.

Решая эту систему в общем виде, можно получить формулы для определения параметров уравнения регрессии: ,

Контрольные вопросы

1. Парный коэффициент корреляции изменяется в следующих пределах: а) от 0 до 1; б) от -1 до 1; в) от - ∞ до + ∞; г) до 0 до + ∞.

 

2. Если парный коэффициент корреляции между признаками х и у равен 1, это указывает на: а) наличие нелинейной функциональной связи между признаками х и у; б) отсутствие связи между признаками; в) наличие линейной функциональной связи между признаками; г) отрицательную линейную связь.

 

3. Уравнение регрессии имеет вид . На сколько единиц своего измерения в среднем изменится у при увеличении х на единицу своего измерения:

а) увеличится на 1,7; б) не изменится; г) уменьшится на 1,7; д) увеличится на 3,4.

 

4. Приведите в соответствие виды зависимостей, изучаемых в статистике, и их характеристику.

1. Парная корреляция А. зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков
2. Частная корреляция Б. зависимость результативного и двух или более факторных признаков, включенных в исследование
3. Множественная корреляция В. связь между двумя признаками (результативным и факторным или двумя факторными)
<== предыдущая лекция | следующая лекция ==>
В статистических исследованиях | Упражнения
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 867; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.