Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Многомерные группировки




И числу детей в 1989 г.

Группировка семей России по месту проживания

(по материалам переписи населения)

Группа семей по месту проживания В том числе подгруппа семей по числу детей Число семей, тыс.
Городское население 1 ребенок  
  2 детей  
  3 детей  
  4 детей  
  5 и более детей  
Итого по группе  
Сельское население 1 ребенок  
  2 детей  
  3 детей  
  4 детей  
  5 и более детей  
Итого по группе  
Итого по подгруппам 1 ребенок  
  2 детей  
  3 детей  
  4 детей  
  5 и более детей  
Всего  

По первому признаку образованы две группы, а по второму - пять. Группировка показывает, что большинство семей и в городе, и в деревне имеет только одного ребенка, а в общей численности семей они составляют 51% (11933:23486)

Число городских семей, в которых два ребенка, меньше почти в 1,4 раза, чем семей с одним ребенком. В сельской местности численность таких семей различается незначительно - всего на 1%.

При построении сложной группировки всегда возникает вопрос о последовательности разбиения единиц исследуемого объекта по признакам. Рекомендуется сначала производить группировку по признакам, значения которых имеют ярко выраженные качественные различия. С увеличением числа группировочных признаков быстро растет количество групп. Группировка с большим числом групп становится ненаглядной. Поэтому, на практике строят сложные группировки не более, чем по трем признакам.

 

Группировка, осуществляемая одновременно по комплексу признаков называется многомерной. Характеристика одной и той же стороны изучаемого явления может быть дана с помощью набора признаков. Например, для характеристики технического уровня развития предприятий может быть использованы следующие показатели: удельный вес активной части промышленно-производственных основных фондов, удельный вес автоматических машин и оборудования в составе рабочих машин и оборудования, электровооруженность труда, машиновооруженность рабочих, коэффициент обновления машин и оборудования.

Характеризуя таким образом каждую единицу совокупности набором признаков, можно рассматривать эту единицу как точку в m -мерном пространстве, а задача многомерной группировки будет состоять в выделении точек, составляющих однородные группы единиц. Исходные данные для задачи многомерной группировки представляют в виде матрицы «объект-признак». Строками ее являются значения признаков, характеризующих соответствующий объект, а столбцами – значения каждого признака для рассматриваемой совокупности объектов.

Мерой «сходства» между единицами может служить различные критерии. В зависимости от выбранного критерия и существуют различные виды многомерной группировки.

Выделяют 3 типа мер сходства:

1. коэффициент подобия;

2. коэффициент связи;

3. показатели расстояния.

Меры первого и второго типов называют мерами близости: чем больше их величины, тем ближе объекты к друг другу.

Обратное положение с показателями расстояния: чем больше их величины, тем больше различия между объектами.

Меры сходства могут определяться как между объектами, так и между признаками.

Для измерения степени близости между парами объектов (i и j) используют коэффициенты подобия S. Один из наиболее простых способов рассчитать этот коэффициент по формуле:

, где Рij – число совпадающих признаков у объектов i и j, а m – общее число признаков, по которым осуществляется сравнение. Очевидно, что 01.

Часто в качестве мер сходства используют коэффициент корреляции – либо как измеритель силы связи между объектами (строками матрицы), либо как измерители связи признаков (столбцами матрицами).

Если признаки не поддаются точной количественной оценке, то мерами их связи служат коэффициенты ранговой корреляции.

Во многих случаях роль меры сходства играет функция расстояния. Для сопоставимости статистических показателей расстояния определяют по статистическим стандартизированным данным, т.е. заменяют первичные данные данными, вычисляемыми по формуле:

Чаще всего принимаются следующие меры расстояния между объектами:

1. хеммингово расстояние:

2. евклидово расстояние:

где xil – значение l-го признака у объекта i

xjl – значение l-го признака у объекта j

Евклидово расстояние не учитывает неравнозначность осей пространства. При ненормированных осях возможен случай, когда 2 объекта, сильно различающихся только по одному признаку, окажутся далекими в евклидовом пространстве. Поэтому часто вводят взвешенное евклидово расстояние, где подбором весов wl пытаются нормировать оси пространства:

, где

Обычно величину wl - обратно пропорциональна среднему квадратическому отклонению σ значений признака хl.

3. расстояние Махаланобиса:

где Xi=(Xi1, …, Xim) – строки значений признаков для объекта i

Xj=(Xj1, …, Xjm) – строки значений признаков для объекта j

R-1 – матрица, обратная матрице парных линейных коэффициентов корреляции признаков.

Применение методов многомерной группировки связано с большой вычислительной работой и осуществляется с помощью специальных алгоритмов, реализованных в различных статистических пакетах прикладных программ.

С помощью различных методов (дендроидов, метода шаров, корреляционных плеяд, многомерной средней, кластерного анализа) осуществляется формирование групп, в которых единицы совокупности объединяются на основании близости по всему комплексу признаков.

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 967; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.