Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проблема інваріантності середніх

Інваріантні алгоритми і середні величини

У теорії вимірювань основну вимогу до алгоритмів аналізу даних формулюють так: висновки, зроблені на основі даних, виміряних у шкалі певного типу, не мають змінюватися після допустимого перетворення цієї шкали. Інакше кажучи, висновки мають бути інваріантні стосовно допустимих перетворень шкали.

Отже, одна з головних цілей ТВ – боротьба із суб’єктивізмом дослідника приписування числових значень реальним об’єктам. Так, відстані можна вимірювати в метрах, мікронах, милях, парсеках та інших одиницях виміру, масу – у кілограмах, пудах, фунтах і т.ін. Ціни на товари та послуги можна зазначати в гривнях, доларах США, євро, кронах, марках та інших валютах (якщо задано курс перерахування). Звернімо увагу на дуже важливу, хоча й цілком очевидну обставину: вибір одиниць виміру залежить від дослідника, тобто це суб’єктивний процес. Статистичні висновки можуть бути адекватні реальності лише тоді, коли вони не залежать від того, яку одиницю виміру обрав дослідник, тобто коли вони інваріантні щодо допустимого перетворення шкали. Виявляється, що сформульована умова доволі сильна.

Нехай Х 1, Х 2, …, Хn – вибірка обсягом n. Часто в різноманітних оцінюваннях використовують середнє арифметичне

Це так звично, що друге слово в цьому терміні часто випускають, що може призводити до помилкових висновків.

Приклад 3.2. Покажемо це на прикладі розрахунку середньої заробітної плати (середнього прибутку) працівників умовного підприємства (табл. 3.1).

Таблиця 3.1. Чисельність працівників різних категорій, їхня заробітна платня та прибуток (в умовних грошових одиницях)

Категорія працівників Кількість Зарплатня Сума
Низькокваліфіковані робітники      
Висококваліфіковані робітники      
Інженери та службовці      
Менеджери      
Генеральний директор      
Загалом      

 

Менеджери – це директори за певними напрямами: виробництвом, фінансами, маркетингом і збутом, персоналом. Керує підприємством генеральний директор. Фонд оплати праці становить 40000 умовних грошових одиниць, працівників загалом 100. Отже, середня заробітна платня становить 40000/100 = 400 одиниць. Але це середнє арифметичне значення зовсім не відповідає інтуїтивному уявленню про «середню зарплатню». Зі 100 працівників лише п’ять мають зарплатню, що перевищує її, а зарплатня інших 95 менша за середнє арифметичне. Причина очевидна: зарплатня однієї людини – генерального директора – перевищує сумарну зарплатню 95 працівників – низькокваліфікованих і висококваліфікованих робітників, інженерів та службовців.

Це нагадує ситуацію в лікарні, у якій середня температура хворих становить 36,6 °С. При цьому частина хворих має температуру близько 35 °С, а інші – близько 40 °С. Водночас середня температура хворих у лікарні становить 36,6 °С! Висновок із цього всього простий – середнє арифметичне можна використовувати лише для досить однорідних сукупностей (без великих відхилень у той або інший бік). Як же можна застосувати середні для описання зарплатні?

Із цією метою цілком природно використати медіану. Для даних табл. 3.1 це середнє арифметичне 50–го та 51–го працівника, якщо їхні заробітні плати розміщено в порядку зростання (спочатку зарплатні 40 низькокваліфікованих робітників, а потім – із 41–го до 70–го –висококваліфікованих). Отже, медіана потрапляє саме на них, і її значення становить 200. У 70 працівників заробітна плата не перевершує 200 одиниць, а в 60 вона не менша, тому медіана показує «центр», біля якого групується основна частка досліджуваних величин. Ще одна середня величина – мода, тобто значення, що зустрічається найчастіше. У розглянутому випадку це зарплатня низькокваліфікованих робітників, тобто 100 одиниць. Отже, для описання зарплатні маємо три середні величини: моду (100 одиниць), медіану (200 одиниць) і середнє арифметичне (400 одиниць). Для розподілів зарплатні та доходів у реальному житті, виконується та сама закономірність: мода менша за медіану, а медіана менша, ніж середнє арифметичне.

Для чого і в прийнятті рішень використовують середні значення? Щоб замінити сукупність чисел одним числом, тобто порівнювати сукупності за допомогою середніх. Інакше кажучи, це частковий випадок інформаційного фільтра агрегування інформації.

Нехай, – множина оцінок експертів, які отримав один об’єкт експертизи (наприклад, перший варіант стратегічного розвитку фірми), другий (що відповідає іншому варіанту розвитку). Яким чином слід порівнювати ці множини? Очевидно, найпростіший спосіб – за середнім значенням.

Постає питання: як обчислювати середні та середнє? Застосовують такі види середніх величин: середнє арифметичне, медіану, моду, середнє геометричне, середнє гармонічне та середнє квадратичне. Загальне поняття середньої величини вперше запропонував французький математик першої половини XIX ст. О.Коші.

ОЗНАЧЕННЯ 3.1. Середнім значенням вибірки Х 1, Х 2, …, Хn називають таку довільну функцію f (Х 1, Х 2, …, Хn), що

min(Х 1, Х 2, …, Хn) £ f (Х 1, Х 2, …, Хn) £ mах(Х 1, Х 2, …, Хn),

тобто для всіх можливих значеннях аргументів значення цієї функції не менше, ніж мінімальне з чисел Х 1, Х 2, …, Хn вибірки та не більше, ніж максимальне з них.

Усі названі вище види середніх являють собою середні в розумінні Коші. Після допустимого перетворення шкали значення середньої величини змінюються. Однак висновки про те, для якої сукупності середнє більше, а для якої – менше, не мають змінюватися (відповідно до вимоги інваріантності висновків, що є основною в ТВ).

Сформулюємо відповідне математичне завдання пошуку виду середніх величин, результат порівняння яких стійкий щодо припустимих перетворень шкали. Нехай f (Х 1, Х 2, …, Хn) – середнє за Коші. Нехай середнє першої вибірки менше, ніж середнє другої, тобто . Тоді згідно теорії вимірювань для стійкості результату порівняння середніх необхідно, щоб для будь–якого припустимого перетворення g із групи припустимих перетворень у відповідній шкалі справедливою була б нерівність

тобто середнє перетворене значень першої сукупності було менше, ніж середнє перетворене значень другої сукупності. Ця умова повинна зберігатись для будь–яких двох сукупностей та й будь–якого припустимого перетворення g. Середні значення, що задовольняють сформульованій умові, називаються припустимими (у відповідній шкалі). Згідно ТВ лише такими середніми можна користуватися при аналізі тверджень експертів й інших даних, що вимірюються у певній розглянутій шкалі. Для даних, що виміряні у шкалі найменувань, у якості середнього пасує лише мода.

 

<== предыдущая лекция | следующая лекция ==>
Види шкал вимірювань | Середні значення в порядковій шкалі
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 379; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.