Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Понятие и виды вариационных рядов




Выбросы и стратегия их обработки

Ошибки - некорректно введенные данные

Отличающиеся значения – Данные не относятся к исследуемому явлению. И исключительно явление.

Выброс (outlier) определяется отдаленностью отдельного наблюдения от основной группы данных. Критическое значение такой отдаленности наблюдения от медианы составляет 3 раза расстояние между верхней и нижней квартилями. В случае одной переменной, наиболее распространенным графическим методом диагностики выбросов является boxplot. В случае многовариантного анализа, определение выбросов очень сложно.

Для определения выбросов в линейной регрессии наиболее простым и информативным методом является визуальный анализ графика выбросы остаются выбросами).

4. Вариационные ряды.

Вариационный ряд – упорядоченное распределение единиц совокупности.

Вар. ряд = ряд распределения.

Бывают:

l ранжированный(если объектов немного) – распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.

l дискретный(Если признак принимает небольшое число значений) – ряд, в основу которого положены признаки с прерывным значением.

l интервальный (Если признак может принимать большое количество значений или эти значения могут быть дробными) – если признак имеет непрерывное значение

4.2. Построение вариационных рядов и их структурные характеристики (медиана, мода, квартили, квинтили…).

Форма построения вариационного ряда зависит от характера изменения изучаемого признака, он может быть построен в форме дискретного ряда или в форме интервального ряда.

По характеру вариации значений признака различают:

  • признаки с прерывным изменением (дискретные);
  • признаки с непрерывным изменением (непрерывные).

l Мода (M0) – наиболее часто встречающееся значение признаков совокупности.

Проблема расчета данного показателя связана с интервальным вариационным рядом.

Сначала находится модальный интервал (интервал, которому соответствует максимальная частота).

, где

ХМ0о – нижняя граница модального интервала;

h – величина интервала;

fMo – 1 - частота интервала, предшествующего модальному;

fMo – частота модального интервала;

fMo + 1 - частота интервала, следующего за модальным.

l Медианае) – значение признака у единицы, делящей ранжированный ряд пополам.

При определении медианы по ранжированному ряду без группировки

Если число единиц совокупности четное, то значение медианы определяется как среднее арифметическое двух центральных значений.

Если медиана рассчитывается по интервальному вариационному ряду, то сначала находят медианный интервал, а затем по формуле рассчитывается значение медианы.

Медианный интервал – это первый интервал, в который попадает 50% совокупности. , где

ХМе – нижняя граница медианного интервала;

f’Me-1 – накопленная частота интервала, предшествующего медианному;

fMe – частота медианного интервала;

∑ fi - сумма накопленных частот.

l Квартили:

Значения признака, которые делят совокупность на 4 равные по числу единиц части.

 

- первый, нижний квартиль.

- третий, верхний квартиль.

Значение Q1 означает, что у 25% единиц совокупности значение показателя меньше квартильного, а у 75% - больше.

Значение Q3: у 25% единиц совокупности значение больше данного.

Межквартильное расстояние Q3 - Q1 характеризует размах вариации в центре распределения. На этом интервале находится 50% единиц изучаемой совкупности.

 

l Квинтили:

Делят выборку на 5 равных частей.

K1 = + i




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 1391; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.