Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Характеристики варіації

Варіація ознаки є властивістю статистичної су­купності і зумовлена дією безлічі взаємопов'язаних причин, серед яких є основні і другорядні. Основні формують центр розподілу, другорядні - варіацію оз­нак, сукупна їх дія - форму розподілу [2]. Чим менша варіація, тим більш надійними, типовішими є характе­ристики центру, насамперед середня.

Для характеристики варіації застосовують систему таких оцінок.

Розмах варіації - це різниця між найбільшим і найменшим значенням ознаки R= xmax - xmln.

В інтервальному ряді розподілу R визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого або ж різницю між серед­німи значеннями цих інтервалів.

Як міра варіації R не завжди може бути надійним, оскільки залежить від двох крайніх значень, які часто не є типовими для сукупності, або мають випадковий характер. Вони отримали назву «викиди». В практиці статистичних досліджень крайні значення підлягають обробці або, принаймні, уважному розгляданню. Як правило, це помилки кодування або реєстрації, іноді вони мають випадковий характер. Тому їх часто про­сто викидають, звужуючи тим самим розмах і роблячи сукупність більш однорідною. Також зменшує вплив випадкових причин так званий квартальний роз­мах, обчислений за формулою

Rq= Q3 – Q1

В усякому разі, відкидаючи крайні значення, слід, пам'ятати, що інколи з ними може бути пов'язане щось цікаве або навіть феноменальне. Замість про­стого відкидання пропонують процедури обчислення оцінок розподілу, які нечутливі до структури даних і отримали назву робастних [1]. Робастними оцін­ками називають також оцінки розподілу, які от­римують при застосуванні цих методів.

Програми статистичних пакетів часто передбачають обчислення оцінок Хампеля, Ендрюса та Т'юки. Наприклад, Т'юки (Tukey) запропонував один з видів робастних оцінок, а саме вінзорізовані оцінки. Суть в тому, що крайні значення не відкидаються а замінюються. Якщо маємо упорядкований ряд зна­чень х1, х2,..., хп, то х1, надається значення х2, а хп -значення хп-1. Якщо така операція не дає бажаних на­слідків, тобто сукупність ще не стає досить одно­рідною, то процедуру повторюють (наприклад, за до­помогою пакета статистичних програм BMDP до 5 разів). Так, при двократній вінзорізації х1 та х2 при­своюється величина варіанти х3, а двом останнім у ряді — величина хп-2.

Важливо підкреслити, що статистичний аналіз від­носиться до таких робіт, де від ретельності підготовки матеріалу може залежати успіх всієї справи. Щодо всіляких процедур «чистки» або попередньої обробки даних, то тут окрім професійного боку справи існує ще й етичний. Дослідник повинен прагнути до об'єк­тивного, науково обгрунтованого результату, а він мо­же виявитись і не таким, як хотілось би.

Середнє відхилення обчислюється як:

1) середнє лінійне відхилення:

а) незважене:

б) зважене:

2) середнє квадратичне відхилення:

а) незважене:

б) зважене:

Характеристика варіації має назву дисперсії:

а) незважена:

б) зважена:

На практиці застосовують більш просту формулу розрахунку дисперсії:

Чим менше середнє відхилення, тим типовіша середня, тим більш однорідна сукупність, а завжди більша за d. В симетричних та помірковано асимет­ричних розподілах = 1,25d. Характеристики R, d та — іменовані величини, які мають одиниці виміру ва­ріюючої ознаки.

При порівнюванні степеня варіації однієї і тієї ж ознаки в різних сукупностях використовують коефіцієнт варіації:

,

Лінійний коефіцієнт варіації:

.

З його допомогою можна оцінити також одно­рідність сукупності. Однорідною прийнято вважати сукупність, для якої Va < 33%, що приймають до уваги при попередній обробці даних.

Розглянемо особливості обчислення деяких харак­теристик для альтернативної ознаки. Позначимо на­явність ознаки через 1, її відсутність — через 0. Частку одиниць, які мають дану ознаку позначимо через р, які не мають — через q.

Тоді:

,

, або

Очевидно, при відсутності варіації ; макси­мальне значення дисперсії становить 0,25 при р = q =0,5. Якщо номінальна ознака приймає більше двох значень, оцінка її варіації дорівнює добутку час­ток:

<== предыдущая лекция | следующая лекция ==>
Характеристики центру розподілу. Середні величини | Характеристика форми розподілу
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 1178; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.