Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Середня і гранична похибки вибірки та необхідна чисельність її при різних способах відбору




У процесі вибіркового дослідження розглядають два типи вибіркових оцінок – точкові та інтервальні.

Точкова оцінка характеризує значення параметра, обчислене на основі вибіркових даних (вибіркова середня та вибіркова частка ), а інтервальна – довірчий інтервал (інтервал значень параметра при даній ймовірності).

Якщо генеральна сукупність розподілена за нормальним законом, то вибіркові характеристики теж будуть розподілені нормально. Для вибірок великого розміру розподіл вибіркових характеристики буде наближено нормальним.

При вибірковому спостереженні крім похибок реєстрації можливі також похибки репрезентативності вибірки, які виникають тому, що структура вибірки дещо відрізняється від структури генеральної сукупності.

Похибками репрезентативності називається різниця між середніми величинами або частками ознаки вибіркової і генеральної сукупності. Похибки репрезентативності бувають систематичними і випадковими.

Систематичні похибки репрезентативності виникають внаслідок порушення принципів проведення вибіркового спостереження. Вони мають тенденцію до збільшення або зменшення величини досліджуваної ознаки.

Випадкові похибки репрезентативності викликані тим, що вибірка не відтворює точно параметри генеральної сукупності.

Визначення величини випадкових похибок репрезентативності є основним завданням теорії вибіркового методу.

Для узагальнюючої характеристики похибки вибірки обчислюють середню помилку репрезентативності, яку позначають буквою грецького алфавіту (мю).

Для визначення середньої похибки власне випадкової і механічної вибірки використовують формули, представлені у таблиці:

Таблиця 1

Формули середньої похибки вибірки при різних способах відбору

Спосіб відбору При визначенні середньої При визначенні частки
Повторний (для )
Повторний (для )
Безповторний (для )
Безповторний (для )

де – середня похибка вибірка; – дисперсія ознаки; – чисельність генеральної сукупності; – частка одиниць, що володіє даною ознакою; – частка одиниць, що не володіє даною ознакою.

Більш точні результати одержуються при безповторному відборі, оскільки одиниці сукупності не повторюються.

Обчислені похибки дозволяють визначити межі середньої та частки генеральної сукупності за формулами:

; .

Поряд з середньою похибкою вибірки обчислюють і граничну похибку вибірки, яка стверджує, що генеральні параметри не вийдуть за межі середньої похибки вибірки лише з певною ймовірністю.

Величину граничної похибки вибірки обчислюють за формулою:

,

де – середня похибка вибірка; – коефіцієнт довіри, який залежить від ймовірності, з якою гарантується гранична похибка вибірки.

Значення і (ймовірності прийняття тієї чи іншої похибки) подані в спеціальних таблицях, де розглядається як функція і обчислюється за формулою:

.

 

 

Запишемо значення цього інтеграла для деяких значень :

  0,683
  0,954
  0,997
  0,999

Для малих вибірок коефіцієнт довіри визначають за розподілом ймовірностей Стьюдента , де – ймовірність, – число ступенів свободи.

Ці показники означають, що з ймовірністю 0,683 можна стверджувати, що гранична похибка вибірки не перевищить , тобто в 68,3% випадків похибка репрезентативності не вийде за межі . По іншому, в 683 випадках із 1000 похибка репрезентативності не перевищить однієї величини середньої похибки. З ймовірністю 0,954 (найбільш часто вживаною на практиці) можна стверджувати, що похибка репрезентативності не перевищить , з ймовірністю 0,997 – не перевищить . З ймовірністю 0,999, близькою до одиниці, слідує що різниця між вибірковими і генеральними параметрами не перевищить чотирикратної похибки вибірки.

Гранична похибка вибірки обчислюється при проведенні вибіркового спостереження за різними формулами залежно від способу відбору. Вона дає можливість записати довірчий інтервал, в якому знаходиться величина генеральної середньої або генеральної частки.

Згідно теореми П.Л. Чебишева про те, що з ймовірністю можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятись від генеральної середньої при проведенні повторної вибірки.

Академік А.А. Макаров довів збереження цієї умови для незалежних спостережень (безповторної вибірки), тобто:

або .

Теорема Я. Бернулі розглядає похибку вибірки для альтернативної ознаки (частки), тобто з ймовірністю, як найближчою до одиниці, можна стверджувати, що для вибірки достатньо великого обсягу вибіркова частка мало відрізняється від генеральної частки, тобто:

або .

Можна записати різні формули для обчислення граничної похибки вибірки, використовуючи формули середньої похибки вибірки, представлені в табл. 1.

За допомогою формул граничної похибки вибірки можна розв’язати такі задачі:

1. Визначити довірчий інтервал генеральної середньої і частки з заданою ймовірністю.

2. Визначити ймовірність того, що різниця між вибірковими і генеральними характеристиками не перевищить визначену величину.

3. Знайти необхідну чисельність вибірки, яка із заданою ймовірністю забезпечить очікувану точність вибіркових характеристики.

При організації проведення вибіркового спостереження важливо правильно визначити необхідний обсяг вибірки, яка з певною ймовірністю забезпечить встановлену точність результатів спостереження. Надзвичайно велика чисельність вибірки призводить до зайвих затрат сил, часу і коштів, недостатня – дасть результати з великою похибкою репрезентативності. Чисельність вибірки залежить від:

· варіації досліджуваної ознаки. Чим більша чисельність вибірки, тим більша варіація, і навпаки;

· розміру можливої граничної похибки вибірки. Чим менший розмір можливої похибки, тим більшим повинен бути обсяг вибірки. За існуючим правилом, якщо похибку необхідно зменшити в раз, то чисельність вибірки збільшити в раз;

· величини ймовірності, з якою гарантуватимуться результати вибірки. Чим більша ймовірність, тим більшим повинен бути обсяг вибірки;

· від способу відбору одиниць у вибіркову сукупність.

Для обчислення необхідного обсягу вибірки потрібно виконати алгебраїчне перетворення формул граничної похибки вибірки при різних способах відбору.

Розглянемо обчислення необхідного обсягу для власне випадкової і механічної вибірки. Використаємо формули граничної похибки вибірки для середньої арифметичної при повторному відборі:

.

Обидві частини формули піднесемо до квадрату, одержимо:

.

Звідси необхідний обсяг вибірки дорівнює:

.

З даної формули слідує, що чисельність вибірки залежить від величини граничної похибки , величини коефіцієнта довіри і величини варіації (дисперсії ).

Аналогічно вводяться формули необхідного обсягу вибірки при обчисленні частки ознаки, при повторному і безповторному відборах. Ці формули представлені в табл. 2.

Таблиця 2

Формули для визначення необхідного обсягу вибірки при різних способах відбору

Спосіб відбору Чисельність вибірки при визначенні
середньої частки
Повторний (для )
Повторний (для )
Безповторний (для )
Безповторний (для )

При типовому способі відбору, коли одиниці в вибірку відбираються з окремих типово однорідних груп, виділених за певною ознакою, варіація групових середніх відсутня, і похибка типової вибірки залежить від середньої з групових дисперсій. Тому в формулах похибок вибірки замість загальної дисперсії потрібно використовувати середню з групових дисперсій: – для середньої і – для частки.

Розрахунок граничної похибки вибірки при типовому способі відбору проводиться за формулами, що подаються у табл. 3.

Таблиця 3

Формули граничної похибки вибірки при типовому відборі

Спосіб відбору Чисельність вибірки при визначенні
середньої частки
Повторний (для )
Повторний (для )
Безповторний (для )
Безповторний (для )

Середня з групових дисперсій обчислюється за формулою:

,

де – дисперсія – тої групи; – кількість одиниць ознаки в – тій групі.

Загальна вибіркова середня визначається за формулою:

,

де – середня – тої групи.

,

де – частка – тої групи.

Середня з внутрішніх дисперсій визначається за формулою:

.

Для визначення необхідної чисельності вибірки при типовому відборі потрібно виконати алгебраїчне перетворення формул граничної похибки вибірки, що представлені в табл. 3.

Розглянемо розв’язок деяких задач до цієї теми, використовуючи розглянуті формули:

Задача 1. Методом власне випадкової повторної вибірки досліджена жирність молока у 100 корів. За даними вибірки середня жирність молока дорівнювала 3,84%, а дисперсія складала 2,60. Визначити:

а) середню похибку вибірки;

б) з ймовірністю, що дорівнює 0,954, довірчий інтервал генеральної сукупності.




Поделиться с друзьями:


Дата добавления: 2015-05-10; Просмотров: 7925; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.03 сек.