КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Понятия сводки и группировки статистических данных
Ошибка статистического наблюдения. Точность и достоверность собираемой статистической информации – важнейшая задача статистического наблюдения. Материалы, собираемые в результате наблюдения, подвергаются всесторонней проверке и контролю. В зависимости от характера и степени влияния на конечные результаты, а также исходя из источников возникновения ошибок, их принято подразделять на следующие: · преднамеренные (злостные); · непреднамеренные. Непреднамеренные ошибки, в свою очередь, подразделяются на: а) случайные; б) систематические; в) репрезентативности (представительности). Преднамеренные завышают или занижают конкретные значения признака, показателя. Известно, что в последние годы в РФ наблюдается массовое сокрытие предприятиями и фирмами прибыли или объектов прибыли от налогообложения. Программа статистического наблюдения предусматривает проверку расчетов прибыли налоговой инспекцией на каждом предприятии. За злостные ошибки к предприятиям или лицам применяются экономические и административные меры. Случайные ошибки чаще всего связаны с невнимательностью регистратора, небрежностью в заполнении документа, неточностью измерительных приборов и т.п. Их принято называть ошибками регистрации. К ним же относятся систематические ошибки, они наиболее опасны, так как в значительной степени влияют на итоговые показатели. Они возникают, например, при округлении признака в большую или меньшую сторону. Ошибки репрезентативности свойственны только выборочному наблюдению. Они показывают, в какой степени выборочная совокупность представляет (репрезентирует) генеральную совокупность. Если выборка организована с нарушениями, то такая ошибка существенно искажает результаты наблюдения. В соответствии с особенностями ошибок статистического наблюдения для проверки его результатов могут применяться логический или счетный контроль собранной информации.
Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведение разрозненных данных воедино. Это происходит в процессе выполнения второго этапа статистического исследования, который носит название «статистическая сводка». Она состоит из подсчёта первичного статистического материала (сводка в узком смысле слова), его группировки, а также представления результатов сводки в виде статистических рядов, таблиц и графиков. Статистическая сводка ведётся по программе, которая составляется заранее. Программа определяет подлежащее и сказуемое сводки. Подлежащее сводки составляют группы, на которые разбивается совокупность явлений. Сказуемое сводки составляют показатели, характеризующие каждую группу и совокупность в целом. Успех сводки во многом зависит от плана её проведения, который содержит указания о последовательности и сроках выполнения отдельных частей сводки и изложения её результатов. Группировкой называется объединение единиц объекта наблюдения в однородные по существенным для них признакам группы. В зависимости от числа признаков в основании группировки выделяют группировки по одному признаку – простые – и группировки по нескольким признакам – сложные. Алгоритм простой группировки. 1. Совокупность упорядочивается по значению группировочного признака. 2. Определяется число групп (m). 3. Единицы с одинаковыми или близкими значениями признака объединяются в группы. 4. Подсчитываются итоги по группам (число единиц совокупности и значения обобщающих показателей). 5. Результаты группировки представляются в виде группировочной таблицы (табл.3)
Таблица 3 Группировочная таблица
Под группировочным признаком понимают признак, по которому происходит объединение отдельных единиц совокупности в однородные группы (признаки могут быть атрибутивными, т.е. смысловыми, качественными, не имеющими количественного выражения – пол, профессия, специализация; и количественными – размер территории, объем продаж и т.п.). Если группировка выполняется по атрибутному признаку, то число групп, в которые объединяются единицы объекта наблюдения, определяется числом разновидностей атрибутивного признака. Так, группировка населения по полу даёт две группы, а группировка его по национальности образует столько групп, сколько различных национальностей имеется среди изучаемого населения. При группировке по количественным признакам возникает вопрос о выборе размера интервала, т.е. разности между наибольшим и наименьшим значениями признака в данной группе. Размер интервала должен быть таким, чтобы полученные группы чётко отличались друг от друга. Интервалы групп могут быть равные и неравные. Разные интервалы целесообразно применять в тех случаях, когда признак изменяется равномерно. При исследовании экономических явлений чаще применяются неравные, прогрессивно увеличивающиеся интервалы. Это объясняется тем, что здесь количественные изменения размера признака имеют неодинаковое значение в низших и высших группах. Например, если разница в числе работников в 50 человек имеет существенное значение для мелкого предприятия, то для крупного такая разница существенного значения не имеет. Интервалы могут быть закрытые (с указанием нижней, так и верхней границ) или открытые (с указанием только одной границы). Для придания группировке строгой определённости верхняя граница предыдущей и нижняя граница последующей группы должны обозначаться различно. Алгоритм построения группировки с равными интервалами включает следующие шаги. 1. Определяется оптимальное количество групп – m. Для больших совокупностей можно воспользоваться формулой американского учёного Стерджесса:
m=1+3,322*lgN,
где N – число единиц совокупности. 2. Определяется величина интервала:
,
где числитель – размах вариации; максимальное значение признака в исследуемой совокупности; минимальное значение признака в исследуемой совокупности; m – число групп. Если в результате деления получится нецелое число, то округлять нужно в большую сторону, а не в меньшую. 3. Определяются границы каждого интервала: Для первого интервала: от до . Для второго интервала: от до . Для m -го интервала: от до . 4. Подсчитывают число единиц, попавших в интервал. Причём единицы, имеющие значение признака, равное граничному, относят только к одному из интервалов. 5. Результаты заносят в таблицу. Рассмотрим пример построения равноинтервального ряда. Пусть по совокупности из 20 студентов изучается посещаемость ими практических занятий по статистике за семестр. (Х – число практических занятий по статистике, на которых студент присутствовал в семестре):
16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.
Число групп для удобства возьмем равным 3, тогда величина интервала будет равна:
.
Границы групп будут следующими:
[0;5,4) [5,4;10,8) [10,8;16,2).
Численность групп будет:
4 7 11
Результаты группировки оформим в виде таблицы (табл.4).
Таблица 4 Равноинтервальная группировка студентов по признаку посещаемости
Группировки с неравными интервалами подразделяют на: 1) группировки с прогрессивно возрастающими или убывающими интервалами (по арифметической либо геометрической прогрессии). Например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100 – 200, 200 – 300, 300 – 500, 500 – 1000, 1000 и более человек. Это объясняется тем, что изменение количества работающих на 50 – 100 человек имеет существенное значение для мелких предприятий, а для крупных – не имеет; 2) группировки с равнонаполненными группами (численность каждой группы примерно одна и та же). Равномерное распределение единиц совокупности по группам обеспечивает статистическую устойчивость характеристик, рассчитанных для отдельных групп. Алгоритм построения равнонаполненной группировки: 1) определяется число групп на основе качественного анализа явления; 2) определяется численность каждой группы (N ) при заданном числе групп – (m) как: N , где N – объём совокупности. Если в результате деления получается не целое число, то численность групп будет не совсем одинаковой, в некоторых группах число единиц будет больше; 3) определяются границы интервалов по группам. Нижняя граница 1-го интервала есть минимальное значение признака в упорядоченной совокупности. Значение верхней границы 1-го интервала (равное нижней границе 2-го интервала) определяется значением признака у N-й единицы, упорядоченной по значению признака совокупности. Верхняя граница 2-го интервала определяется значением признака у единицы под номером 2N и т.д. Построим равнонаполненную группировку совокупности 20 студентов по признаку «посещаемость практических занятий» - Х. Исходные данные:
16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.
Решение 1. Примем число групп равным 3. тогда N=20/3=6,67. 2. Упорядочим совокупность студентов по значению признака Х:
Определим границы интервалов по группам:
1 группа 0 7 2 группа 7 14 3 группа 14 16 Результаты сведём в табл.5.
Таблица 5 Равнонаполненная группировка студентов по признаку посещаемости
Дата добавления: 2014-12-29; Просмотров: 866; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |