Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Зависимость количества пар из разнородных элементов от степени однородности распределения




Мера качественной вариации.

Интуитивное представление о разбросе значений номинального признака.

 

Ясно, что для номинальных признаков некорректным является использование всех приведенных выше мер разброса. Попытаемся понять, как можно интерпретировать такой разброс. Предположим, что в аудитории сидят 100 человек, на которых могут быть надеты свитеры пяти разных расцветок: синие, красные, белые, желтые и зеленые. Вероятно, естественно предполагать, что разброс значений признака “цвет свитера человека” минимален (отсутствует), когда все люди одеты в свитеры одного цвета. Максимальным же разброс естественно считать в том случае, когда все цвета встречаются одинаково часто: 20 человек одеты в синие свитера, 20 человек – в красные и т.д. Другими словами максимальным разброс целесообразно считать при равномерном распределении. Чем ближе распределение к равномерному – тем разброс больше, чем дольше от равномерного – тем разброс меньше. Известны по крайней мере две меры разброса, опирающиеся на этот принцип – мера качественной вариации и энтропийный коэффициент разброса.

 

 

Чтобы прояснить смысл рассматриваемой меры, прибегнем к упрощенному примеру с дихотомическим признаком. Предположим, что мы организовали танцевальный кружок из 10 человек и пытаемся путем перебора различных вариантов формирования разнополых пар найти такие, в которых мужчина и женщина наиболее удачно подходят друг другу как танцоры. Рассмотрим варианты, отраженные в таблице 3.

Мы видим, что наибольшее количество пар можно организовать, когда распределение по полу равномерно (т.е. количество мужчин равно количеству женщин) или, в соответствии с приведенными выше рассуждениями, когда разброс членов кружка по полу максимален. Более внимательное рассмотрение таблицы

Таблица 3

Количество мужчин в кружке Количество женщин в кружке Количество возможных танцевальных пар
     
     
     
     
     
     
     
     
     
     
     

 

позволяет придти к выводу о том, что уровень разброса респондентов по полу и в остальных случаях четко коррелирует с количеством пар из разнородных элементов: чем больше разброс, тем больше пар можно составить. Рассматриваемая мера разброса – мера качественной вариации – опирается именно на это обстоятельство: ее “ядро” составляет величина, равная количеству упомянутых пар. Поясним на примере способ расчета этой меры (табл.4).

Таблица 4

Частотная таблица для расчета коэффициента качественной вариации

Наименование градации рассматриваемого номинального признака A B C
Частота встречаемости градации      

 

Вычислим коэффициент по следующей формуле:

Нетрудно видеть, что в числителе дроби стоит число, равное количеству пар, которые можно составить из разнокачественных элементов: произведение 30×20 – количество пар, первый элемент который обладает свойством А, а второй – свойством В; 30×70 – то же для свойств А и С; 20×70 – для свойств В и С. Другими словами, числитель отражает существо нашего понимания разброса.

Однако считать, что числитель может служить мерой разброса - нельзя. Границы его изменения зависят от объема выборки, от величины конкретных частот. Поэтому, ограничившись числителем, мы тем самым потеряли бы возможность сравнивать меры разброса для разных совокупностей: число, отвечающее большому разбросу в малой выборке, вполне может говорить о весьма несущественном разбросе в большой выборке. Это недопустимо, поскольку, как мы уже отмечали, любой анализ данных связан прежде всего со сравнением разных совокупностей объектов.

Покажем на примере, что максимальное значение числителя рассматриваемой дроби действительно зависит от величин конкретных используемых частот и поэтому числитель не может использоваться в качестве меры разброса. Рассмотрим две частотные таблицы - ту же, которую рассматривали выше и другую, отличающуюся от первой уменьшением всех частот в 10 раз. Другими словами, рассмотрим две разные выборки, характеристики которых отражены в таблице 5.

Таблица 5




Поделиться с друзьями:


Дата добавления: 2015-04-23; Просмотров: 746; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.