Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Частоты – это числа, показывающие: сколько раз в совокупности встречается данное значение признака




Аналитическая статистика

С одной стороны, статистика – это совокупность числовых показателей, характеризующих общественные явления и процессы (статистика труда, статистика транспорта).

С другой – под статистикой понимается практическая деятельность по сбору, обработке, анализу данных по различным направлениям общественной жизни.

С третьей стороны, статистика – это итоги массового учета, опубликованные в различных сборниках.

Наконец, в естественных науках статистикой называются методы и способы оценки соответствия данных массового наблюдения математическим формулам.

Таким образом, статистика – это общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной.

Каждый отдельно взятый элемент данного множества называется единицей статистической совокупности. Единицы совокупности характеризуются общими свойствами, т.е. признаками.

Статистическая закономерность устанавливается на основе анализа массовых данных, это обусловливает ее взаимосвязь с законом больших чисел.

Ряды распределения, построенные по количественному признаку (в порядке возрастания или убывания признака) называются вариационными. Вариационный ряд распределения состоит из двух элементов: вариант и частот. Количественные значения признака в вариационном ряду распределения называются вариантами.

Частости (относительная частота, плотность частоты) это частоты, выраженные в процентах к итогу или в долях. Сумма всех частостей, выраженных в процентах, равна 100 %, в долях – 1.

 

§ 2. Технология работы в режиме «Анализ данных»

Пакет анализа представляет собой надстройку (вспомогательную программу, служащую для добавления в Microsoft Office специальных команд или возможностей). Чтобы использовать надстройку в Excel, необходимо сначала загрузить ее.

1) Выберите кнопку «Office» …Параметры Excel… Надстройки.

2) Щёлкните по кнопке «Перейти».

3) В раскрывшемся окне активируйте опцию «Пакет анализа».

 

5) ОК

6) В меню «Данные» появляется надстройка «Анализ данных».

В ней представлен список методов статистической обработки данных:

 

Алгоритм выполнения индивидуального задания 1

1) Скопируйте свой вариант задания на лист Excel.

2) Исключите суммарные итоги по федеральным округам и Российской федерации в целом (удалите эти строки).

3) Ранжируйте полученный вариационный ряд, используя кнопку.

4) Найдите первый и последний децили. Исключите из вариационного ряда значения первого и последнего дециля (используя статистическую функцию «ПЕРСЕНТИЛЬ»). Для этого выбирается, категория статистические, функция ПЕРСЕНТИЛЬ, заполните раскрывшееся окно

Значение К=0,1, поскольку первый дециль составляет одну десятую часть персентиля. Для нахождения последнего персентиля вместо 0,1 проставьте 0,9

Регионы, попавшие в первый и последний дециль выделите курсивом и заливкой, они из анализа исключаются.

 

5) Для оставшегося вариационного ряда постройте интервальный ряд распределения с равными интервалами, предварительно рассчитав количество групп по формуле Стерджесса n = 1 + 3,322 lgN,

где n — число групп; N — число единиц совокупности. Поскольку оставшихся регионов 63, n = 1 + 3,322 lg63=7.

6) Рассчитайте интервал группировки.

где = 8268,7 и = 607,9 максимальное и минимальное значения признака в совокупности; n =7 - число групп. Тогда =1094,4

 

Определите начальные и конечные значения каждого из 7 интервалов по формуле hконечные = hначальные + h, например, h1конечное = h1начальное + h= 607,9 + 1094,4 = 1702,3. Каждый из интервалов удобно выделить своей заливкой.

7) Определите количество единиц в каждой группе и накопленную частоту. Накопленная частота рассчитывается путем последовательного суммирования частот предшествующих интервалов.

 

8) Рассчитайте среднюю взвешенную величину по формуле

где - средневзвешенная арифметическая всего интервального ряда, - средняя арифметическая в каждой группе, - число элементов (частота) в каждой группе.

 

9) Рассчитайте моду (значение признака, наиболее часто встречающееся в исследуемой совокупности) по формуле

где и i - соответственно нижняя граница и величина модального интервала; - частоты модального, предмодального и послемодального интервалов. В рассматриваемом примере модальный интервал (тот, в который входит наибольшее количество элементов) – второй (в него входят 25 регионов). Тогда нижняя граница равна 1702,3, частоты модального интервала равна 25, предмодального интервала равна 17, послемодального интервала равна 6, величина модального интервала равна интервалу группировки 1094,4.

 

Мода равна

10) Рассчитайте медиану(значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности по формуле, где и i — соответственно нижняя граница и величина медианного интервала; — частота медианного интервала; — кумулятивная частота предмедианного интервала.

В интервальном ряду медианным интервалом является тот в который попадает половина суммарного значения 63/2 = 31,5. В рассматриваемом примере модальный интервал второй. Тогда нижняя граница равна 1702,3, частоты модального интервала равна 25, кумулятивная частота предмедианная интервала равна 17, величина модального интервала равна интервалу группировки 1094,4.

 

Медианная частота равна

11) Постройте полигон распределения (графического изображения дискретного вариационного ряда), строится по столбцам Число элементов.

 

12) Постройте кумуляту интервального ряда распределения. Она строится по столбцу Накопленная частота.

 

13) Сделайте вывод об однородности совокупности. Для такого вывода нужно рассчитать коэффициент вариации, а для этого сначала рассчитать среднеквадратическое отклонение, для определения которого, ранее нужно рассчитать дисперсию.

а) Расчёт дисперсии (среднего квадрата отклонений индивидуальных значений от средней величины по формуле

Например, для первого интервала числитель дисперсии рассчитывается (1176,2- 2942,60)2*17=53045413

 

Дисперсия равна 4129771,1

б) Расчёт среднеквадратического отклонения (оно показывает, на сколько в среднем отклоняются конкретные варианты признака от его среднего значения). Вычисляется как квадратный корень из дисперсии. Среднеквадратическое отклонение равно 2032,2

в) Расчёт коэффициента вариации (она характеризует долю усредненного значения отклонений от средней величины). При этом совокупность считается однородной, если V не превышает 33%. Коэффициент вариации рассчитывается по формуле

V=2032,2/2942,6*100%=70%. Вывод – совокупность неоднородна.

14) Определите скошенность и величину асимметрии.

 

15) Для характеристики асимметрии применяется нормированный момент третьего порядка:.

As =0, т. е., если ряд распределения симметричен;

As >0, т.е.,если скошенность ряда правосторонняя;

As <0, т.е.,если скошенность ряда левосторонняя;

Если As < 0,5 (независимо от знака) то асимметрия считается незначительной.

Если As > 0,5 то асимметрия считается значительной.

Например, для первого интервала числитель асимметрии рассчитывается (1176,2- 2942,60)3*17= -93701660477

 

 

Асимметрия равна 1,36. Вывод: скошенность правосторонняя(>0) и значительная(>0,5).

Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, рассчитываемой по формуле:, где n — число наблюдений.

Если, то асимметрия существенна и распределение признака в генеральной совокупности не является симметричным.

Если, то асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств.

;.

Т.е., > 2, асимметрия существенна.

16) Рассчитайте эксцесс и сделайте вывод о нормальности распределения. Под эксцессом понимается степень островершинности (крутизны) распределения, при этом в качестве эталона берется нормальное распределение.

 

17) Характеристикой эксцесса является нормированный момент четвертого порядка.

Для вариационного ряда нормального распределения Ех = 0.

Для более островершинных распределений, чем нормальное, Ех > 0, для более плосковершинных Ех < 0.

Например, для первого интервала числитель эксцесс рассчитывается (1176,2- 2942,60)4*17= 1,65519E+14.

Числ.эксцесса
1,65519E+14
1,09829E+13
 
1,74119E+13
1,20002E+14
 
3,64637E+15

 




Поделиться с друзьями:


Дата добавления: 2014-10-23; Просмотров: 874; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.019 сек.