КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Расчет числа и ширины интервалов группировки данных
Определение числа интервалов группировки данных 1). Для качественного (атрибутивного) группировочного признака: а) если качественный признак имеет мало разновидностей, то число интервалов определяется числом разновидностей; б) если качественный признак имеет большое число разновидностей, то разрабатывается классификация разновидностей, т.е. сходные по своим особенностям разновидности объединяются в группы (классы). Классификация – устойчивое разграничение единиц наблюдения по атрибутивному признаку (более устойчивое, чем при группировке). Классификации разрабатываются Росстатом и используются в течение длительного времени (ОКОГУ, ОКФС, ОКОПФ и т.д.).
2). Для количественного группировочного признака число интервалов зависит объема изучаемой совокупности: а) если признак дискретный и имеет небольшое число значений, то выделяют столько групп, сколько значений признака. б) если значений дискретного признака много или признак непрерывный, то создают группы с интервальным значением признака. 1). Для качественного (атрибутивного) группировочного признака интервалов группировки не может быть! 2). Для количественного группировочного признака интервалы группировки устанавливаются только при условии непрерывности количественного признака.
Интервалы могут быть равными и неравными. а). Неравные интервалы применяются при группировках, которые охватывают массу единиц неоднородной совокупности с неравномерными и значительными колебаниями признака. б). Равные интервалы применяется при группировках единиц, составляющих однородные совокупности. Ширина равного интервала определяется по формуле: , (2.1) где – максимальное и минимальное значение признака в совокупности; – число интервалов (групп).
Число групп определяется по формуле Стерджеса: =1+3,22 lg n, (2.2) где n – число значений признака (единиц совокупности).
Согласно формуле (2.2) получаем оптимальное соотношение объема исследуемой совокупности (n) и числа групп (т) (табл. 2.1). Таблица 2.1. Таблица оптимальных соотношений
Пример. Для = 20 рабочих предприятия, попавших в обследование размера заработной платы, число групп будет равно = 5 (табл. 2.2). Таблица 2.2. Группировка рабочих предприятия по размеру заработной платы
При группировке данных необходимо знать следующее: 1. Минимальное и максимальное значение признака в группе называется нижней () и верхней () границей интервала (пример: в таблице 2.2 нижняя граница второго интервала по размеру заработной платы – 5 000 руб., верхняя граница второго интервала – 10 000 руб.). 2. Интервалы, в которых указана лишь одна граница (верхняя или нижняя), называются открытымиинтервалами (пример: в таблице 2.2 открыт первый интервал – отсутствует нижняя граница; открыт пятый интервал – отсутствует верхняя граница размера заработной платы). Форма записи открытых интервалов показывает, в какую группу относить единицу совокупности с пограничным значением признака (пример: табл. 2.2, в первый интервал входят рабочие с заработной платой до 5 000 руб. не включая, в пятый интервал входят рабочие с заработной платой равной или выше 20 000 руб.). 3. Пограничные значения признака всегда включаются в следующий интервал (пример: табл. 2.2, при наличии рабочих с заработной платой 5 000 руб. их численность включается в интервал, для которого пограничное значение является нижней границей, т.е. во второй интервал. Аналогично численность рабочих с заработной платой 10 000 руб. учитывается в третьем интервале и т.д.). 4. Ширина открытого интервала равна ширине прилежащего (последующего или предыдущего) интервала (пример: в таблице 2.2 ширина первого интервала равна ширине прилежащего (последующего к нему) – второго интервала: ; ширина открытого пятого интервала равна ширине прилежащего (предыдущего к нему) – четвертого интервала: ). 5. Все интервалы группировки должны быть заполнены единицами наблюдения (частота не может равняться нулю). В противном случае группировку следует повторить, уменьшив число интервалов на единицу (построить группировку повторно). 6. Мелкие группы (менее 10% совокупности)при группировкемогут быть объединены рубрикой «прочие».
Дата добавления: 2014-01-15; Просмотров: 4068; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |