КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Суть статистичного зведення. Види зведення 7 страница
Таблиця 11.3. Окремі значення коефіцієнта довіри та ймовірності
Гранична помилка – це максимально можлива помилка для взятої ймовірності, тобто розмір граничної помилки вибірки залежить від того, з якою імовірністю вона розраховується. Таблиця 11.4. Формули для розрахунку граничних помилок вибірки
Так як чисельність вибіркової сукупності () менше чисельності генеральної сукупності (, то додатковий множник або буде завжди менше одиниці. Тому помилка вибірки при безповторному способі також завжди менша, ніж при повторному відборі. За допомогою граничної помилки вибірки можна визначити довірчі межі генеральної середньої і частки з певною імовірністю, тобто вона дає можливість встановити, в яких межах лежить значення генеральної середньої або частки (довірчий інтервал): – довірчий інтервал для середньої величини; – довірчий інтервал для частки. При проведенні статистичного аналізу часто постає потреба порівняти помилки вибірки різних ознак або однієї і тієї самої ознаки в різних сукупностях. Такі порівняння виконують за допомогою відносної помилки, яка показує, на скільки відсотків вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна помилка для середньої визначається за формулою: Vμ = . Також її розмір можна визначити на основі квадратичного коефіцієнта варіації, у даному випадку формули приймають наступний вигляд: для повторної вибірки Vμ ; для безповторної вибірки Vμ . Відносну помилку вибірки для частки розраховують за формулою: Vμ . На практиці достатнім рівнем точності вважається Vμ ≤ 10 %.
11.4. Порядок визначення необхідної чисельності вибірки При організації вибіркового спостереження слід звернути увагу на те, що розмір помилки вибірки залежить від багатьох факторів. Одним з таких факторів є чисельність вибіркової сукупності, тому однією із задач вибіркового методу є визначення оптимальної чисельності вибірки (). Питання про оптимальну чисельність вибірки має важливе практичне значення, тому що збільшення відсотка вибірки призводить до зростання обсягів дослідницьких робіт, додаткових витрат праці та матеріальних витрат. З іншого боку, якщо взяти недостатню кількість проб, то результати досліджень можуть мати великі погрішності. Ці умови обов’язково слід враховувати при організації вибіркового спостереження. Необхідну чисельність вибірки, яка із заданою імовірністю забезпечує очікувану точність вибіркових показників, можна визначити на основі перетворення формул граничної похибки вибірки при різних способах відбору. Розглянемо порядок обчислення необхідної чисельності вибірки тільки для простого випадкового методу, який є найбільш поширеним у практиці вибіркового методу. Таблиця 11.5. Формули для обчислення необхідної чисельності вибірки при простому випадковому способі відбору одиниць у вибіркову сукупність
11.5. Питання для самоперевірки 1) В чому полягає суть вибіркового спостереження? 2) Назвати переваги вибіркового спостереження перед суцільним. 3) Дайте визначення генеральної сукупності. 4) Що розуміється під вибірковою сукупністю? 5) Перелічіть основні способи відбору одиниць у вибіркову сукупність. 6) Дайте характеристику простому випадковому способу відбору одиниць у вибіркову сукупність. 7) При якому способі передбачається відбір одиниць цілими групами сукупності, в межах яких обстежують всі одиниці без винятку? 8) Вкажіть методи відбору одиниць у вибіркову сукупність. 9) Чим відрізняється повторний відбір від безповторного? 10) До якого методу відбору слід віднести відібрану одиницю, яка повертається в сукупність і може знову потрапити у вибірку? 11) Який спосіб відбору одиниць у вибіркову сукупність є класичним? 12) Що означає помилка вибірки? Вказати види помилок вибірки. 13) Дайте характеристику стандартної та граничної помилки вибірки, вказати зв’язок між ними. 14) Чим відрізняється випадкова помилка вибірки від систематичної? 15) Вкажіть які два типи оцінок параметрів генеральної сукупності використовують при вибірковому методі? Дайте їх характеристику. 16) Вкажіть формули для розрахунку граничної помилки вибірки при простому випадковому способі відбору одиниць у вибіркову сукупність: а) для середньої величини; б) для частки. 17) Від чого залежить коефіцієнт довіри? 18) Що характеризує довірчий інтервал? 19) У яких випадках удаються до розрахунку відносної помилки вибірки та що вона показує? 20) Вказати формули для розрахунку відносних помилок вибірки. 21) Як визначають необхідну чисельність вибірки для середньої і частки в разі повторного та безповторного відбору?
Глава 12. Перевірка статистичних гіпотез 12.1. Основні поняття Статистичні гіпотези – це припущення про вигляд розподілу генеральної сукупності або про параметри відомих розподілів, якщо відома вибірка з генеральної сукупності. Суть перевірки гіпотез полягає в тому, щоб визначити, узгоджуються чи ні результат вибірки з гіпотезою, випадковими чи невипадковими є розбіжності між гіпотезою і даними вибірки. Найчастіше гіпотеза, яку належить перевірити, формулюється як відсутність розбіжності (нульова розбіжність) між невідомим параметром генеральної сукупності G і заданою величиною А, а тому її позначають H 0. Зміст гіпотези записують після двокрапки, наприклад H 0: G=А. Кожній нульовій гіпотезі протиставляють альтернативну Нa. При формулюванні Нa враховується вагомість відхилень (G-А): для додатних відхилень Н 1: G > А,для від’ємних – Н 1: G < А,для тих і інших – Н 1: G ≠ А. Наприклад, якщо H 0: випадкова величина X розподілена за нормальним законом, то H 1: випадкова величина X не розподілена за нормальним законом. Якщо вибіркові дані суперечать гіпотезі H 0, вона відхиляється, коли ці дані узгоджуються з гіпотезею Н0, вона приймається. При цьому за даними випадкової вибірки можна зробити хибний висновок. Похибкиможуть бути першого або другого роду. Якщо за висновком буде відкинута правильна гіпотеза, то кажуть, що це похибка І роду. Ймовірність здійснити похибку першого роду позначають a і називають рівнем значущості. Якщо ж за висновком буде прийнята неправильна гіпотеза, то кажуть, що це похибка ІІ роду. Ці висновки конкуруючі, і зменшення ймовірності α одного зумовлює збільшення ймовірності β іншого. Оскільки уникнути похибки неможливо, а наслідки їх, як правило, різновагомі, то в кожному конкретному дослідженні прагнуть мінімізувати ту похибку, яка пов’язана з більшими втратами. Ймовірності похибок наведено в табл. 12.1. Таблиця 12.1. Ймовірність ризиків помилкових рішень при перевірці гіпотез
Правило, за яким гіпотеза Н0 відхиляється або приймається, називається статистичним критерієм. Математичною основою будь-якого критерію є статистична характеристика Z з відомим розподілом, значення якої визначається за даними вибірки. Кожне значення характеристики Z має певну ймовірність F (Z). Якщо вибіркове значення Z малоймовірне, гіпотеза Н 1відхиляється. Межу малоймовірності Z називають рівнем значущості α. Очевидно, що α – це ймовірність похибки І роду, а тому залежно від змісту гіпотези Н0 і наслідків її відхилення рівень значущості визначають у кожному конкретному дослідженні. Зазвичай вибирають один із рівнів α, для яких табульовані значення статистичних характеристик критеріїв. Це α = 0,10; 0,05; 0,025; 0,01. Значення статистичної характеристики критерію Z1-α поділяє множину вибіркових значень Z на дві частини: а) область прийняття гіпотези і б) критичну область. Якщо вибіркове значення Z потрапляє у критичну область, гіпотеза Н0 відхиляється, якщо в область прийняття гіпотези — приймається. Саме тому значення Z1-α називають критичним. Рис. 12.1. Лівостороння та двостороння критичні області Залежно від того, як сформульована альтернативна гіпотеза, критична область може бути односторонньою (ліво- чи правосторонньою) або двосторонньою (рис. 12.1). 12.2. План перевірки статистичних гіпотез 1. Формулюють нульову Н0 та альтернативну Н 1гіпотези; 2. Вибирають статистичну характеристику Z, за значеннями 3. Визначають рівень значущості α і відповідне йому критичне 4. За результатами вибірки розраховують фактичне (вибіркове) значення статистичної характеристики Z, яке порівнюють з
12.3. Критерії 1. Критерій Пірсона (c2). Для перевірки гіпотези про розподіл генеральної сукупності застосовують критерій Пірсона (χ2).Для перевірки основної гіпотезу H 0 про те, що генеральна сукупність розподілена нормально (при заданому рівні значущості a), треба 1) обчислити теоретичні частоти n для варіант вибірки; 2) обчислити спостережене значення критерію c2 за формулою ; 3) знайти ступінь свободи за формулою k = m – 3 (m – кількість варіантів вибірки або часткових інтервалів варіант); 4) в таблиці знайти критичну точку , яка відповідає заданому рівню значущості a та ступенем свободи k; 5) якщо , то гіпотезу H 0 треба прийняти; якщо , то гіпотезу H 0 треба відхилити. 2. Закон Ст’юдента. Нехай є дві нормально розподілені генеральні сукупності, що мають рівні дисперсії, а математичні сподівання, взагалі кажучи, різні. Із сукупностей зробимо вибірки об’єму відповідно n 1 та n 2 і знайдемо вибіркові середні та , а також виправлені дисперсії S 1 та S 2 відповідно. Перевіримо гіпотезу H 0: a 1 – a 2 = c 0 (H 1: a 1 – a 2 ¹ c 0). Для цього за вибіркову функцію візьмемо функцію , яка розподілена за законом Ст’юдента зі ступенями волі, що дорівнює n 1 + n 2 –2. Для заданого рівня значущості a за допомогою таблиць можна знайти критичну область для статистичної характеристики n з врахуванням альтернативної гіпотези H 1. 12.4. Приклад перевірки статистичної гіпотези Порядок перевірки статистичних гіпотез розглянемо на прикладі співвідношення середніх двох сукупностей. Припустимо, ведеться вибірковий контроль тривалості служби деталей одного виду, виготовлених за різними технологіями. Контролю піддано 5 деталей, виготовлених за старою технологією, і 4 – за новою, тобто п 1 = 5, п 2 = 4. Вибіркові оцінки середніх і дисперсій відповідно становили: = 580 год. при = 308; = 612 год. при = 329. Різниця між середніми ( – )= (612 – 580) = 32 год. Потрібно визначити, чи істотна ця різниця, тобто чи зумовлена вона відмінностями технологій, чи випадкова. Нульова гіпотеза формулюється на припущенні, що відхилення середніх випадкові Н0: = . Альтернативна гіпотеза передбачає, що нова технологія збільшує тривалість служби деталі: Нa: > . За такого формулювання Нa виконується одностороння (правостороння) перевірка. Статистичною характеристикою гіпотези Н0: = є нормоване відхилення середніх , яке підпорядковане розподілу Ст’юдента з числом ступенів свободи . У нашому прикладі = 5 + 4–2 = 7; оцінка дисперсії розраховується як середня арифметична зважена з дисперсій, що характеризують варіацію тривалості служби деталей за кожною технологією ; значення t -критерію . Перевіримо гіпотезу Н0 проти Н 1з рівнем значущості α = 0,05. За даними табл. 12.2 критичне значення t 0,95(7) = 1,89, що менше за фактичне (t = 2,37). Отже, нульова гіпотеза Н0: = відхиляється, і з імовірністю 0,95 можна стверджувати, що нова технологія збільшує термін служби деталей. Таблиця 12.2. Значення квантілів розподілу t розподілу Стьюдента α = 0,05
У разі двосторонньої перевірки гіпотези, коли Нa: ≠ ,використовують критичне значення для , наприклад при α = 0,05 це буде t 0,975(). Процедура перевірки гіпотез використовується при порівнянні вибіркових характеристик (середньої, частки, дисперсії) з відповідними нормативами, порівнянні характеристик двох вибіркових сукупностей, оцінюванні істотності розбіжностей двох розподілів, у дисперсійному та кореляційному аналізі.
12.5. Питання для самоперевірки 1) Що називають статистичною гіпотезою? 2) Яким чином визначаються похибки першого та другого роду? 3) Дайте визначення понять: „критерій”, „критична область”, „область прийняття гіпотези”, „критичні точки критерію”. 4) Наведіть план перевірки статистичних гіпотез. 5) Для яких випадків використовують критерій Пірсона? 6) Як виконати перевірку гіпотези про розподіл генеральної сукупності застосовуючи критерій Пірсона? 7) В яких випадках користуються критерієм Ст’юдента? 8) Як виконати перевірку гіпотези про розподіл генеральної сукупності застосовуючи критерій Ст’юдента? 9) У яких випадках використовується процедура перевірки гіпотез?
Глава 13. Подання статистичних даних: таблиці, графіки, карти 13.1. Загальне поняття про статистичні таблиці, їх значення, основні вимоги щодо побудови статистичних таблиць Унаслідок опрацювання даних різних видів статистичних спостережень отримують багато цифрового матеріалу, який подають у таблицях або у вигляді графіків. Статистичні таблиці призначені для найбільш раціонального, систематизованого відображення статистичних даних про досліджувані явища та процеси за допомогою цифр, розташованих у певному порядку. Таблиця являє собою такий спосіб подання інформації, при якому цифровий або текстовий матеріал групується в рядки і графи, відокремлені одна від іншої вертикальними та горизонтальними лініями. Значення статистичних таблиць полягає в тому, що вони дають змогу охопити матеріали статистичного зведення в цілому та суттєво полегшити їх порівняння та аналіз. Будь-яка статистична таблиця складається з двох складових елементів, які наведені на рис.13.1.
Рис. 13.1. Складові елементи статистичних таблиць У практиці статистико-економічних досліджень використовують таблиці різної складності, що залежить від мети та особливостей об’єкта дослідження, обсягу наявної інформації. Види таблиць, які використовуються при проведенні статистичного аналізу, наведено на рис.13.2. Рис. 13.2. Класифікація статистичних таблиць за різними ознаками У простих статистичних таблицях підметне має групувань, підмет таких таблиць становить перелік елементів сукупності, територіальний або хронологічний ряд. Часто використовують територіально-хронологічні таблиці. Прикладом такого виду таблиць є розподіл чисельності населення за декілька періодів часу за регіонами країни. У групових статистичних таблицях підмет поділяється на окремі групи за однією з істотних ознак. До найпростішого виду групових таблиць можна віднести розподіл населення країни за статтю. У комбінаційних таблицях підмет поділяється на окремі групи за двома і більше ознаками, взятими у комбінації. До прикладу такого виду таблиць слід віднести розподіл чисельності населення країни водночас за місцем проживання та статтю. Аналітичні таблиці є результатом обробки й аналізу цифрових показників. До неаналітичних таблиць вміщують здебільшого необроблені статистичні дані, необхідні лише для подання інформації або констатації певного стану речей. Для статистичних таблиць найвідповідальнішим моментом є розробка присудка. Статистичний присудок, об’єктивно перебуваючи в діалектичному взаємозв’язку із статистичним підметом таблиці, має бути представлений таким чином, щоб можна було б одержати повну характеристику виділених груп, охарактеризувати їхні істотні особливості. Лише такий органічний зв’язок цих двох складових робить таблиці єдиним цілим, що дає змогу виконати цілу низку завдань у статистичному дослідженні. Складання статистичної таблиці має два етапи. На першому проектується макет таблиці, на другому – таблиця заповнюється статистичними даними. Макет статистичної таблиці наведено на рис. 13.3. Таблиця 13.1. Головка Назва таблиці
Підзаголовки граф Заголовки рядків (боковик) Заголовки граф Рис. 13.3. Макет побудови статистичної таблиці При побудові статистичних таблиць необхідно дотримуватися основних правил та вимог: ► Кожна таблиця повинна мати назву, яку розміщують над нею і друкують симетрично до тексту. Назву таблиці починають з великої літери. Назву наводять жирним шрифтом. ► Таблиці не треба робити громіздкими та перевантажувати деталями. Інколи доцільно замість однієї великої таблиці побудувати декілька пов’язаних, логічно послідовних таблиць. У даному випадку таблиці слід нумерувати. Номер таблиці приводять над її назвою у правому верхньому куті. Слово „Таблиця” починають з великої літери. Порядковий номер таблиці вказує на номер розділу та номер таблиці у даному розділі. ► За логікою побудови таблиці її підмет розміщують у боковику. Боковик, як і головка, вимагає лаконічності. Повторювальні слова тут виносять в об’єднувальні рубрики; загальні для всіх заголовків боковика слова розміщують у заголовку над ним. ► Заголовки граф пишуть з великої літери, підзаголовки – з малої, якщо вони складають одне речення із заголовком, і з великої, якщо вони є самостійними.
Дата добавления: 2014-12-29; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |