Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Решение. Множество мыслимых объектов изучаемого явления, называется генеральной совокупностью.Часть объектов




СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ.

Лабораторная работа №2

 

Множество мыслимых объектов изучаемого явления, называется генеральной совокупностью. Часть объектов, отобранных из генеральной совокупности по определенным правилам, называется выборкой, или выборочной совокупностью.

Дадим другое определение выборки: выборкой объема n называются числа x1, x2,…, xn (называемые вариантами), получаемые на практике при n – кратном повторении эксперимента в неизменных условиях. На практике выборку чаще всего представляют статистическим рядом. Статистическим дискретным рядом называется ранжированный в порядке возрастания (убывания) ряд вариантов с соответствующими им частотами (частостями).

Очевидно, что представление результатов наблюдений в виде статистического дискретного ряда распределения на практике удобно лишь в случае, если объем выборки n~(10-20). Если же количество различных вариант существенно больше, то результаты представляют в виде статистического интервального ряда распределения. Для построения такого ряда всю область наблюдаемый значений изучаемого признака X разбивают на m интервалов (см. п 1.5), вычисляют середины интервалов zi, и считают число элементов выборки, попадающих в каждый интервал ni .

Числа ni, показывающие, сколько раз встречаются варианты из данного интервала в выборке, называются частотами, а их отношение к общему числу наблюдений ni/n – частостями, или относительными частотами.

Полигон служит для отображения дискретного статистического ряда и представляет собой ломаную, в которой концы отрезков имеют координаты (zi, ni).

Гистограмма представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака mi=xi+1-xi и высотами равными частотам ni.. Гистограмма служит для визуального представления только интервальных вариационных рядов.

Накопленные частоты для каждого интервала находятся последовательным суммированием частот (частостей) всех предшествующих интервалов, включая данный.

Кумулятивная кривая (кумулята) – кривая накопленных частот.

Рассмотрим решение задачи первичной обработки статистических данных в программе EXCEL на следующем примере.

 

ПРИМЕР. Дана выборка числа посетителей некоторого специалиста поликлиники за 25 дней.

14, 18, 16, 21, 12, 19, 27, 19, 15, 20, 27, 29, 22, 28, 19, 17, 18, 24, 23, 22, 19, 20, 23, 21, 19.

Построим статистический ряд, полигон, гистограмму и кумулятивную кривую.

Откроем книгу программы EXCEL. Введем в первый столбец (ячейки А1-А25) исходные данные. Определим область чисел, в которой лежат данные. Для этого найдем максимальный и минимальный элементы выборки. Введем в В1 подпись «Максимум», а в В2 - подпись «Минимум». В соседних ячейках С1 и С2 определим функции «МАХ» и «MIN». Для этого ставим курсор в С1 и вызываем мастер функций, нажав на кнопку fx, в открывшемся окне в поле «Категория» выбираем «Статистические», и ниже ищем функцию МАКС(MAX) и вызываем ее двойным щелчком мыши по названию. В качестве аргумента функции (в графе «Число 1») обведем область данных (ячейки А1-А25). Поле «Число 2» оставляем пустым. Нажимаем «ОК». Результатом будет число 29. Ставим курсор в ячейку С2 и аналогично вводим функцию МИН(MIN). Результат – число 12.

Все числа попадают в интервал [12,29], но для удобства нахождения шага интервала расширим размах, пусть XMAX=30. Размах вариации R=XMAX –XMIN = 30-12=18. Согласно таблице (п.1.5.) разделим его шесть интервалов, найдем шаг: h=18/6=3, получим интервалы:

12-15, 15-18, 18-21, 21-24, 24-27, 27-30.

В ячейки D2-D9 вводим нижние границы интервалов группировки – числа 12, 15, 18, 21, 24, 27. В ячейки E2-E9 вводим верхние границы интервалов группировки – числа 15, 18, 21, 24, 27, 30. В столбце F вычислим середины интервалов: для этого в ячейку F2 ставим курсор и вызываем функцию из категории статистические СРЗНАЧ(AVERAGE), в качестве аргументов функции задаем диапазон D2:E2. Выделяем ячейку F2 и мышкой, удерживая правый нижний угол, протаскиваем до ячейки F9, тем самым копируем введенную формулу на весь диапазон F2-F9.

Для вычисления частот ni используют функцию ЧАСТОТА(FREQUENCY), находящуюся в категории Статистические (Массив)». Введем ее в ячейку G2. В строке «Массив данных» введем диапазон выборки (ячейки А1-А25). В строке «Массив интервалов» введем диапазон верхних границ интервалов группировки (ячейки E2-E7). Результат функции является массивом и выводится в ячейках G2-G7. В Excel для полного вывода (не только первого числа в G2) нужно выделить ячейки G2-G7, обведя их мышью, и нажать F2, а далее одновременно CTRL+SHIFT+ENTER. Результат – частоты интервалов 3,4,9,5,2,2.

 

Для построения гистограммы нужно выбрать ВСТАВКА/ ДИАГРАММА или нажать на соответствующий значок на основной панели (при этом курсор должен стоять в свободной ячейке). Далее выбрать тип: ГИСТОГРАММА, вид по выбору, на основной панели ВЫБРАТЬ ДАННЫЕ, Появиться диалоговое окно ВЫБОР ИСТОЧНИКА ДАННЫХ, в строке ДИАПАЗОН обвести частоты G2-G7, перейти в окно ПОДПИСИ ГОРИЗОНТАЛЬНОЙ ОСИ, нажать ИЗМЕНИТЬ и обвести диапазон E2-E7 и ОК. Ввести название «ГИСТОГРАММА», подписи осей: ось Х - «ИНТЕРВАЛЫ» и ось Y -«ЧАСТОТА», нажать ГОТОВО.

Для построения полигона перейти на пустую ячейку, выбрать ВСТАВКА/ДИАГРАММА /ГРАФИК. В строке ДИАПАЗОН обвести частоты G2-G7, перейти в окно ПОДПИСИ ГОРИЗОНТАЛЬНОЙ ОСИ и ввести середины интервалов F2-F7. Далее ввести название «ПОЛИГОН» и подписи по осям.

Для построения кумулятивной кривой нужно посчитать накопленные частоты. Для этого в ячейку H2 вводим «=G2», в H3 – вводим «=H2+G3»

и автозаполнением перетаскиваем эту ячейку до F9. Далее строим график как и в случае полигона, но в строке ДИАПАЗОН вводим накопленные частоты, ссылаясь на H2-H7, а в окне ПОДПИСИ ГОРИЗОНТАЛЬНОЙ ОСИ вводим диапазон F2-F7.

Для подсчета частостей (относительных частот) в ячейку I2 вводим «==G2/25», автозаполняем до I9. Для построения гистограммы и полигона в качестве ряда можно использовать частости.

 

 

Задание к лабораторной работе №2.

1. Изучить п.1, п.3, п.4, п.6.

2. По данным выборки построить интервальный ряд, полигон, гистограмму и кумулятивную кривую (первый столбец – номер варианта). В качестве ряда для построения гистограммы и полигона использовать частости.

3. По виду гистограммы (полигона) сделать предварительное предположение о виде распределения изучаемого признака.

4. Выучить определения (выделены курсивом).

 

  Выборка
1.                              
                             
2. 13,4 14,7 15,2 15,1 13,0 8,8 14.0 17.9 15.1 16.5 16.6 14.2 16.3 14.6 11.7
16.4 15.1 17.6 14.1 18.8 11.6 13.9 18.0 12.4 17.2 14.5 16.3 13.7 15.5 16.2
3.                              
                             
4.                              
                             
5. 23.7 4.4 41.4 19.2 23.2 24.5 31.0 33.3 22.2 34.0 33.5 17.5 29.7 25.1 21.1
20.7 15.8 22.1 30.0 33.0 25.8 19.9 25.9 14.1 18.4 15.9 26.4 25.3 22.9 14.2
6.                              
                             
7. 10.8 7.0 13.0 7.6 15.0 14.1 11.2 13.9 8.6 12.3 12.8 16.7 11.7 11.3 11.7
16.9 19.0 11.6 11.4 12.4 9.4 10.5 6.8 11.1 16.8 11.5 8.7 14.7 6.2 10.3
8.                              
                             
9.                              
                             
10. 1.7 4.1 4.3 2.6 0.9 0.8 1.2 2.1 3.2 2.9 1.1 3.2 4.5 2.1 3.1
5.1 1.1 1.9 0.9 3.1 0.9 3.1 3.3 2.8 2.8 2.5 4.0 4.3 1.1 2.1
11.                              
                             
12.                              
                             

 

Контрольные вопросы:

1. В чем суть выборочного метода?

2. Дайте определение понятиям: генеральная совокупность, выборка.

3. Что такое репрезентативность выборки? Требование к выборке.

4. Что называется статистическим дискретным рядом?

5. Опишите методику построения статистического интервального ряда.

6. Назовите виды визуального представления статистических данных.

7. Для чего используется визуальное представление данных.

 

 




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 660; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.025 сек.