Существуют точечные и интервальные оценки генеральных параметров.
Точечной называют оценку, которая определяется одним числом. К таким оценкам относятся, например,
– выборочная средняя , или для сгруппированного вариационного ряда ;
– выборочная дисперсия , или для сгруппированного вариационного ряда , или ;
– выборочное среднее квадратическое отклонение и др.
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны быть:
– несмещенными;
– эффективными;
– состоятельными.
Оценка называется несмещенной, если математическое ожидание ее выборочного распределения совпадает со значением генерального параметра.
Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками, т.е. обнаруживает наименьшую случайную вариацию.
Точечная оценка называется состоятельной, если при увеличении объема выборочной совокупности она стремиться к величине генерального параметра.
Например, выборочная средняя есть состоятельная, несмещённая оценка генеральной средней . Для выборки из нормальной генеральной совокупности эта оценка является также и эффективной.
При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами – концами интервала – доверительного интервала.
Интервальные оценки позволяют установить точность и надежность оценок.
Для оценки генерального параметра с помощью доверительного интервала необходимы три величины:
– значение выборочного показателя;
– критерий надежности , или показатель безошибочных прогнозов, значение которого определяется заранее, при планировании исследования, исходя из представления о большей или меньшей ответственности возможных результатов работы;
– ошибка репрезентативности или показатель точности выборочного параметра определяется на основе выборочных данных по формулам математической статистики.
Например, доверительный интервал для генеральной средней находится по формуле: при уровне значимости .
Пример 1. Частота пульса по данным медицинского осмотра 17 девочек – первоклассниц: 76, 70, 66, 68, 70, 72, 74, 76, 78, 70, 82, 68, 74, 70, 70, 70. Найти точечные оценки выборки и построить полигон относительных частот.
2) Вероятность попадания в интервал вычисляется по следующей формуле , где n – объем выборки, а ni – частота встречаемости i – го признака. Вычисления pi выполним в таблице:
X
ni
pi
0,06
0,12
0,35
0,06
0,12
0,18
0,06
0,06
3) Построим полигон относительных частот. Для построения на координатной плоскости отметим точки с координатами (xi, pi).
4) Вычислим точечные оценки:
– выборочную среднюю:
– выборочную дисперсию:
– выборочное среднее квадратическое отклонение:
.
Пример 2. Пусть даны следующие результаты измерений: 82, 104, 85, 79, 87, 102, 91, 77, 88, 74, 96, 84, 63, 68, 88, 71, 85, 86, 96, 72, 77, 95, 74, 81, 85, 95, 87, 77, 82, 79, 83, 85, 93, 84, 88, 84, 86, 86, 91, 91 и выполните статистическую обработку данных по следующей схеме:
1) выполнить ранжирование признака и составить безинтервальный вариационный ряд распределения, выбрав его значений (согласно своему варианту);
2) составить равноинтервальный вариационный ряд, разбив всю вариацию на интервалов;
3) построить гистограмму распределения;
4) найти числовые характеристики выборочной совокупности. Для упрощения вычислений перейдите к новой варианте – , значениями которой будут являться середы интервалов;
5) по результатам обработки выборочных данных выдвинуть гипотезу о нормальном распределении генеральной совокупности, например, по виду гистограммы, и выполнить ее проверку, используя правило «»;
6) построить кривую нормального распределения по опытным данным, приняв в формуле Гаусса математическое ожидание и ;
7) найти доверительный интервал для генеральной средней . Принять уровень значимости
Решение:
1) В качестве выборочных данных взяли числа, находящиеся в двух первых столбцах таблицы. Выполним ранжирование выборочных данных:
Таким образом, имеем: .
2) Для построения равноинтервального вариационного ряда:
– найдем по формуле Стерджеса число интервалов : ;
– вычислим ширину интервала ;
– вычисления границ интервалов и пр. выполним в таблице:
Границы
интервалов
[63;
69,83)
[69,83;
76,66)
[76,66;
83,49)
[83,49;
90,32)
[90,32;
97,15)
[97,15;
104)
Число попаданий в интервал,
Вероятность попадания в интервал,
0,05
0,1
0,225
0,375
0,2
0,05
Плотность вероятности,
0,007
0,015
0,033
0,055
0,029
0,007
–
Середина интервала,
66,425
73,235
80,085
86,915
93,745
100,575
–
3) Построим гистограмму распределения:
4) вычислим основные числовые характеристики выборки:
– выборочную среднюю:
– выборочную дисперсию:
– выборочное среднее квадратическое отклонение: .
5) Выдвигаем гипотезу: данная выборка сделана из нормально распределенной генеральной совокупности, о чем свидетельствует вид гистограммы распределения.
Для проверки выдвинутой гипотезы воспользуемся правилом «», согласно которому при нормальном распределении признака все его значения принадлежат интервалу (), а значит . Проверим это:
;
.
Таким образом, при уровне значимости принимаем выдвинутую гипотезу: выборка принадлежит нормально распределенной генеральной совокупности.
6) Для построения кривой нормального распределения по опытным данным примем в формуле Гаусса математическое ожидание и .
Кривая распределения представляет собой график функции плотности вероятности.
Плотность вероятности нормального распределения вычисляется по формуле Гаусса:
,
где x- значение варианты,
- значение выборочной средней,
- значение выборочной дисперсии,
- выборочное среднее квадратическое отклонение.
Для построения кривой Гаусса достаточно вычислить координаты 7 точек:
; ; ; .
7) найдем доверительный интервал для генеральной средней. Для этого вычислим:
– ;
– ;
– , здесь найдено по заданным значениям и (или по таблице Приложения 3;
Таким образом, получаем, что или при уровне значимости .
Упражнения:
1. Представить в виде статистического дискретного ряда данные о длине листьев садовой земляники (в см) и построить полигон частот: 8.2, 9.7, 6.6, 7.4, 6.4, 6.6, 8.4, 7.1, 8.0, 9.0, 6.0, 7.6, 8.1, 5.8, 7.3, 8.2, 6.4, 7.7.
2. Построить полигон частот о относительных частот по распределению выборки
X
m
Построить гистограмму относительных частот по распределению выборки
X
10-15
15-20
20-25
25-30
30-35
m
Построить гистограмму изменения кровяного давления у 200 практически здоровых женщин в возрасте 60-65 лет по данным статистического распределения:
X, мм рт.ст.
m
X, мм рт.ст.
m
X, мм рт.ст.
m
70-80
100-110
130-140
80-90
110-120
140-150
90-100
120-130
150-160
По данным задач 2 - 4 построить эмпирическую функцию распределения.
Построить график эмпирической функции распределения по данным выборки xi: 2,0; 2,8; 2,3; 3,4; 2,9; 2,8; 3,0; 3,2; 3,0;2,8.
Из продукции, произведенной фармацевтической фабрикой за месяц, случайным образом отобраны 15 коробочек некоторого гомеопатического препарата, количество таблеток в которых оказалось равным соответственно 50, 51, 48, 52, 51, 50, 49, 50, 47, 50, 51, 49, 50, 52, 48. Представить эти данные в виде дискретного статистического ряда распределения, построить полигон частот, найти точечные и интервальную (с доверительной вероятностью, равной 0,95) оценки.
При 12-кратном измерении температуры раствора серной кислоты получены следующие значения: 20,0; 20,3; 20,0; 20,2; 19,5; 20,5; 19,7; 20,0; 20,4; 20,0; 19,6; 19,8. Дать точечную и интервальную (с доверительной вероятностью, равной 0,95) оценки истинной концентрации раствора, а также вычислить относительную погрешность измерения концентрации.
Длительность лечения больных пневмонией в стационаре (в днях): 15, 20, 18, 20, 25, 11, 12, 13, 24, 23, 24, 21, 22, 23, 23, 22, 21, 14, 14, 22, 15, 16, 20, 20, 16, 16, 20, 17, 17, 19, 19, 19, 18, 18, 18, 19, 19, 17, 17, 18. Выполните статистическую обработку данных по следующей схеме: 1) выполнить ранжирование признака и составить безинтервальный вариационный ряд распределения, выбрав его значений (согласно своему варианту); 2) составить равноинтервальный вариационный ряд, разбив всю вариацию на интервалов; 3) построить гистограмму распределения; 4) найти числовые характеристики выборочной совокупности. Для упрощения вычислений перейдите к новой варианте – , значениями которой будут являться середы интервалов;5) по результатам обработки выборочных данных выдвинуть гипотезу о нормальном распределении генеральной совокупности, например, по виду гистограммы, и выполнить ее проверку, используя правило «»; 6) построить кривую нормального распределения по опытным данным, приняв в формуле Гаусса математическое ожидание и ; 7) найти доверительный интервал для генеральной средней . Принять уровень значимости
Результаты динамометрии правой руки 40 студентов в кг: 44, 78, 47, 79, 54, 52, 56, 50, 55, 48, 51, 66, 74, 60, 42, 60, 76, 49, 45, 69, 51, 45, 46, 59, 61, 44, 62, 70, 45, 47, 44, 71, 46, 52, 43, 45, 70, 71, 53, 71. Выполните статистическую обработку данных по следующей схеме: 1) выполнить ранжирование признака и составить безинтервальный вариационный ряд распределения, выбрав его значений (согласно своему варианту); 2) составить равноинтервальный вариационный ряд, разбив всю вариацию на интервалов; 3) построить гистограмму распределения; 4) найти числовые характеристики выборочной совокупности. Для упрощения вычислений перейдите к новой варианте – , значениями которой будут являться середы интервалов;5) по результатам обработки выборочных данных выдвинуть гипотезу о нормальном распределении генеральной совокупности, например, по виду гистограммы, и выполнить ее проверку, используя правило «»; 6) построить кривую нормального распределения по опытным данным, приняв в формуле Гаусса математическое ожидание и ; 7) найти доверительный интервал для генеральной средней . Принять уровень значимости
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав!Последнее добавление