КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Характеристики варіації
Варіація ознаки є властивістю статистичної сукупності і зумовлена дією безлічі взаємопов'язаних причин, серед яких є основні і другорядні. Основні формують центр розподілу, другорядні - варіацію ознак, сукупна їх дія - форму розподілу [2]. Чим менша варіація, тим більш надійними, типовішими є характеристики центру, насамперед середня. Для характеристики варіації застосовують систему таких оцінок. Розмах варіації - це різниця між найбільшим і найменшим значенням ознаки R= xmax - xmln. В інтервальному ряді розподілу R визначають як різницю між верхньою межею останнього інтервалу і нижньою межею першого або ж різницю між середніми значеннями цих інтервалів. Як міра варіації R не завжди може бути надійним, оскільки залежить від двох крайніх значень, які часто не є типовими для сукупності, або мають випадковий характер. Вони отримали назву «викиди». В практиці статистичних досліджень крайні значення підлягають обробці або, принаймні, уважному розгляданню. Як правило, це помилки кодування або реєстрації, іноді вони мають випадковий характер. Тому їх часто просто викидають, звужуючи тим самим розмах і роблячи сукупність більш однорідною. Також зменшує вплив випадкових причин так званий квартальний розмах, обчислений за формулою Rq= Q3 – Q1 В усякому разі, відкидаючи крайні значення, слід, пам'ятати, що інколи з ними може бути пов'язане щось цікаве або навіть феноменальне. Замість простого відкидання пропонують процедури обчислення оцінок розподілу, які нечутливі до структури даних і отримали назву робастних [1]. Робастними оцінками називають також оцінки розподілу, які отримують при застосуванні цих методів. Програми статистичних пакетів часто передбачають обчислення оцінок Хампеля, Ендрюса та Т'юки. Наприклад, Т'юки (Tukey) запропонував один з видів робастних оцінок, а саме вінзорізовані оцінки. Суть в тому, що крайні значення не відкидаються а замінюються. Якщо маємо упорядкований ряд значень х1, х2,..., хп, то х1, надається значення х2, а хп -значення хп-1. Якщо така операція не дає бажаних наслідків, тобто сукупність ще не стає досить однорідною, то процедуру повторюють (наприклад, за допомогою пакета статистичних програм BMDP до 5 разів). Так, при двократній вінзорізації х1 та х2 присвоюється величина варіанти х3, а двом останнім у ряді — величина хп-2. Важливо підкреслити, що статистичний аналіз відноситься до таких робіт, де від ретельності підготовки матеріалу може залежати успіх всієї справи. Щодо всіляких процедур «чистки» або попередньої обробки даних, то тут окрім професійного боку справи існує ще й етичний. Дослідник повинен прагнути до об'єктивного, науково обгрунтованого результату, а він може виявитись і не таким, як хотілось би. Середнє відхилення обчислюється як: 1) середнє лінійне відхилення: а) незважене: б) зважене: 2) середнє квадратичне відхилення: а) незважене: б) зважене: Характеристика варіації має назву дисперсії: а) незважена: б) зважена: На практиці застосовують більш просту формулу розрахунку дисперсії: Чим менше середнє відхилення, тим типовіша середня, тим більш однорідна сукупність, а завжди більша за d. В симетричних та помірковано асиметричних розподілах = 1,25d. Характеристики R, d та — іменовані величини, які мають одиниці виміру варіюючої ознаки. При порівнюванні степеня варіації однієї і тієї ж ознаки в різних сукупностях використовують коефіцієнт варіації: , Лінійний коефіцієнт варіації: . З його допомогою можна оцінити також однорідність сукупності. Однорідною прийнято вважати сукупність, для якої Va < 33%, що приймають до уваги при попередній обробці даних. Розглянемо особливості обчислення деяких характеристик для альтернативної ознаки. Позначимо наявність ознаки через 1, її відсутність — через 0. Частку одиниць, які мають дану ознаку позначимо через р, які не мають — через q. Тоді: , , або Очевидно, при відсутності варіації ; максимальне значення дисперсії становить 0,25 при р = q =0,5. Якщо номінальна ознака приймає більше двох значень, оцінка її варіації дорівнює добутку часток:
Дата добавления: 2014-01-04; Просмотров: 1208; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |