Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Статистические оценки параметров распределения




ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО И СТАТИСТИЧЕСКОГО РЯДОВ

Поскольку математическая статистика полностью основана на методах теории вероятностей, то выборочные характеристики вариационного ряда будут аналогичны числовым характеристикам дискретной случайной величины.

Пусть выборка задана вариационным или статистическим рядом

x i x 1 x 2 ... x k
m i m 1 m 2 ... m k п
f i f 1 f 2 ... f k 1

Составим следующую таблицу:

Теория вероятностей Математическая статистика
Понятие Формула Понятие Формула
  Математическое ожидание M(X) = х1·р1 + +х2·р2+…+хn·рn,   Выборочное среднее = х1·f1 + +х2·f2+…+ хn·fn, или  
  Дисперсия D (X) = M (X 2) – (M (X))2 Выборочная дисперсия , где , или  
  Средне- квадратическое отклонение   Выборочное средне- квадратическое отклонение  

Важность найденных эмпирических характеристик заключается в том, что при достаточно большом п они близки к соответствующим теоретическим значениям, что более подробно будет рассмотрено в следующем параграфе.

В примере 30.1 найдем числовые характеристики вариационного ряда

x i 4,5 6,0 6,5 7,0 7,5 8,0 9,0
m i                

а) выборочное среднее, т.е. средний балл, набранный абитуриентами на экзамене по математике;

б) дисперсию выборки;

в) среднее квадратичное отклонение выборки.

Решение. а) Для вычисления выборочной средней воспользуемся формулой:

, тогда

=.

Итак, средний балл у 10 наудачу выбранных абитуриентов равен 7,15.

б) Найдем дисперсию выборки по формуле, где. Получим, что

.

Тогда 52,775 – (7,15)2 = 1,6525

в)следовательно, балла.

Если в условии задачи ряд представлен в интервальном виде, то для расчетов в качестве x i берут середину интервалов. Так в примере 30.1 для интервального вариационного ряда

x i [4,0 – 6,0) [6,0 – 8,0) [8,0 -10,0]
m i        

выборочные характеристики будут следующие (в качестве x i берем середины интервалов: соответственно числа 5, 7 и 9):

= балла;

, 56,2 – (7,4)2 = 1,44,

балла.

Видим, что ответы получились практически одинаковые, зато вычисления во втором случае гораздо проще. Таким образом, если нужно быстро получить ответ и небольшими погрешностями можно пренебречь, то при расчетах можно использовать интервальный вариационный или статистический ряд.

Контрольные вопросы:

1. Какие числовые характеристики выборки существуют?

2. Каковы формулы для нахождения числовых характеристик выборки?

3. Какие значения выбирают в качестве вариант при работе с интервальным вариационным рядом?

4. Решите задачу: Измерение роста (в см) 100 студентов-первокурсников дало следующие результаты:

Рост 154-158 158-162 162-166 166-170 170-174 174-178 178-182
Число студ-тов              

Найдите выборочную среднюю и выборочное среднее квадратичное отклонение роста первокурсников.

 

 

Рассмотренные нами в разделе «математическая статистика» относительные частоты, выборочное среднее, выборочная дисперсия, выборочное среднее квадратичное отклонение являются эмпирическими характеристиками случайной величины (т.к. зависят от конкретного проведенного испытания, если провести испытание еще раз, результаты второго опыта могут быть отличными от первого). Они определяются только после проведенного испытания.

В отличие от эмпирических, в теории вероятностей мы имели дело с теоретическими характеристиками события или случайной величины, которые определялись из теоретико-вероятностных соображений (например, равновозможности элементарных событий) и не зависели от конкретного испытания.

Так, при подбрасывании игральной кости теоретическая вероятность появления «6» равна 1/6 ≈ 0,17. Однако частота появления «6» может быть определена только после реального подбрасывания кости. Если в 100 испытаниях «6» выпала 13 раз, то относительная частота появления «6» (0,13) не будет совпадать с вероятностью, вычисленной теоретическим путем (0,17). На практике эмпирические и теоретические частоты не всегда совпадают. Однако в силу закона больших чисел при большом объеме выборки относительная частота появления варианты практически не отличается от ее вероятности. А как быть с числовыми характеристиками выборки? Совпадают ли рассчитанные нами по результатам опытов эмпирические числовые характеристики с реальными М(Х) и D(Х)?

Народная мудрость гласит: семь раз отмерь, один раз отрежь. Экспериментатор, желая найти искомую величину (массу, длину, скорость, заряд) всегда прибегает к измерениям. Но любые способы измерения величин содержат неустранимые погрешности, и несколько раз измеряя одну и ту же величину при одних и тех же условиях, можно получить отличающиеся друг от друга значения. Так, Миликен, измеряя заряд электрона, получил следующие данные:

4,781·10-10 Кл; 4,795·10-10 Кл; 4,769·10-10 Кл; 4,792·10-10 Кл; 4,779·10-10 Кл. Какое же число взять в качестве оценки заряда электрона?

Существует два вида оценок измерений: точечная и интервальная.

Точечная оценка – оценка, которая определяется одним числом и обеспечивает хорошее приближение исследуемого параметра.

Пусть цель испытаний - исследовать случайную величину Х (например, срок службы лампочек). Проведем серию экспериментов: Х: х1, х2…хп.

Поскольку все результаты являются случайными, и проводя эксперимент еще раз мы получили бы несколько отличающиеся значения случайной величины, будем считать, что у нас п различных экспериментов:

1) Х 1: х11, х12…х1п, для этих данных свои М(Х1) и D(Х1).

2) Х 2: х21, х22…х2п, для этих данных свои М(Х2) и D(Х2).

п) Хп: хп1, хп2…хпп, для этих данных свои М(Хп) и D(Хп).

Полученные возможные значения М(Х1), М(Х2)… М(Хп), D(Х1), D(Х2)… D(Хп) - точечные оценки исследуемой величины Х. А как они согласуются с реальными М(Х) и D(Х)? Для ответа на этот вопрос рассмотрим свойства точечных оценок:

1. Точечная оценка называется несмещенной, если математическое ожидание М(Х1), М(Х2)… М(Хп) совпадает с реальным математическим ожидаем случайной величины Х: М(Х) =, а математическое ожидание D(Х1), D(Х2)… D(Хп) совпадает с реальной дисперсией случайной величины Х: D(Х) =.

Это означает, что оценивая реальное математическое ожидание величиной М(Х1), М(Х2) или М(Хп) (только одной по итогам проведенного опыта), мы не допустим ошибок либо в сторону завышения, либо занижения реального значения.

2. Несмещенная точечная оценка называется состоятельной, если с увеличением числа опытов п дисперсия М(Х1), М(Х2)… М(Хп) стремится к нулю, и дисперсия D(Х1), D(Х2)… D(Хп) стремится к нулю.

Это означает, что разброс значений М(Х1), М(Х2)… М(Хп) стремится к нулю, значит, они практически не отличаются друг от друга.

Встает вопрос: какие выборочные характеристики (, лучше всего оценивают математическое ожидание и дисперсию реальной величины Х с точки зрения состоятельности и несмещенности?

Теорема 1. Выборочное среднее, вычисленное по п независимым наблюдениям над случайной величиной Х, является состоятельной и несмещенной оценкой математического ожидания М(Х).

Так, в опыте Миликена в качестве оценки заряда электрона следует взять выборочную среднюю:

(4,781+4,795+4,769+4,792·10+4,779)·10-10/5 = 4,783·10-10 Кл.

А что же является состоятельной несмещенной оценкой дисперсии? Оказывается, что выборочная дисперсия является состоятельной, но не является несмещенной оценкой дисперсии D(Х).

Теорема 2. Исправленная выборочная дисперсия s2, вычисленное по п независимым наблюдениям над случайной величиной Х, является состоятельной и несмещенной оценкой дисперсии D(Х), т.е. М(s2) = D(Х) и D(s2)→ 0 при п→∞.

Таким образом, в практических исследованиях для оценки дисперсии используется исправленная выборочная дисперсия s2, которая рассчитывается по формуле: s2 =

Тогда в примере 30.1 состоятельной несмещенной оценкой математического ожидания является, значит М(Х) ≈ 7,17 балла.

Для оценки дисперсии рассчитаем исправленную выборочную дисперсию: 1,6525, п = 10 s2 =, следовательно, D(Х) балла2.

Ответ: М(Х) ≈ 7,17 балла, D(Х) балла2.

Следствие. Относительная частота события А является состоятельной и несмещенной оценкой неизвестной вероятности Р(А) этого события.

Пример 34.1. Задача об оценке численности популяции животных

Для оценки неизвестной численности популяции животных одного вида (N) производится отлов зверей. Выловленных особей подсчитывают (п1), «помечают» и выпускают обратно. Затем производится повторный отлов зверей. Здесь подсчитывается общее число выловленных животных (п2) и количество «помеченных» при первом отлове особей (п3). Как можно, используя значения п1, п2 и п3, оценить численность популяции N?

Решение. Пусть событие А1 – поймать животное при первом отлове, событие А2 - поймать животное при втором отлове.

Поскольку относительная частота события является состоятельной и несмещенной оценкой вероятности этого события, найдем вероятность события А1 как отношение числа пойманных при первом отлове животных п1 к общей численности популяции N. Таким образом, Р (А1) =.

Аналогично Р (А2) =. Тогда вероятность того, что животное будет поймано и при первом, и при втором отлове равно, а это не что иное, как Р (А1∙А2).

С другой стороны, будем считать, что по условиям проведения эксперимента события А1 и А2 независимы, тогда сможем применить теорему умножения вероятностей:

Р(А1∙А2) = Р(А1) Р(А2) = ∙N∙ п3= п1∙п2 N =.

Мы получили формулу для приближенной оценки численности популяции по числу выловленных при двух отловах животных.

Контрольные вопросы:

1. Какие характеристики случайной величины называют теоретическими, а какие эмпирическими?

2. Что называют точечной оценкой проведённых исследований или измерений?

3. Назовите два основных свойства точечных оценок. Дайти им определения.

4. Сформулируйте теоремы о состоятельных несмещенных оценках М(Х) и D(Х).

5. Решите задачу: Два проверяющих независимо проверяют таблицу результатов измерений. Первый обнаружил 12 ошибок, второй – 18 ошибок. При сравнении двух списков ошибок оказалось, что у проверяющих совпадают 9 ошибок. Сколько ошибок в таблице, вероятнее всего, осталось не замечено?




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 741; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.028 сек.