Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Выборочный метод

Фундаментальные понятия статистической теории – генеральная и выборочная совокупности.

Генеральная совокупность – это множество всех однородных объектов, подлежащих изучению.

Выборочной совокупностью, или выборкой, называется некоторое множество объектов случайно отобранных из генеральной совокупности.

Объёмом совокупности называется число её объектов.

Например, если из 10000 изготовленных деталей для обследования отобрано 100, то объём генеральной совокупности N=10000, а выборки – n=100.

Выборка должна быть репрезентативной (представительной), т.е. такой, по которой можно уверенно судить об интересующем признаке всей генеральной совокупности. Выборка будет репрезентативной, если её осуществить случайным образом.

Пусть для изучения некоторого признака проводятся независимые испытания (наблюдения) в одинаковых условиях, в результате которых получены определённые числовые значения х1, х2, …, хп (п – объём выборки). Если эти значения разместить в порядке возрастания, то полученная возрастающая последовательность наблюдаемых значений будет называться дискретным вариационным рядом, а сами отдельные значения – вариантами.

Если имеются равные варианты, то дискретный ряд будет состоять из х1, х2, …, хk вариант, каждая из которых будет характеризоваться своей частотой появления
п1, п2, …, пk,
причём в сумма всех частот появления вариант будет равна объёму выборки:

п1+ п2+ …+пk=п.

Относительная частота варианты – отношение её частоты к объёму выборки: wi=ni/n.

Сумма относительных частот всех вариант равна единице: .

Статистическое распределение выборки представляет собой соответствие между вариантами и их относительными частотами, которое для наглядности может быть построено на графике.

Если изучаемый признак является непрерывной величиной, то вариационный ряд будет интервальным. Например, имеются результаты измерений непрерывной случайной величины Х, для которой а – наименьшее значение, а b – наибольшее. В процессе обработки результатов отрезок разбивается на k элементарных отрезков, подсчитываются ni – число значений величины Х на каждом из этих интервалов (хi-xi-1).

Разности между двумя значениями случайной величины, образующих элементарный отрезок (хi-xi-1), называются интервальными промежутками.

Формируется интервальный вариационный ряд, подсчитываются относительные частоты случайной величины на каждом интервале ni /(хi-xi-1).

Разность между наибольшим (b) и наименьшим значениями случайной величины (а) называется размахом вариации.

Вариационный ряд является наиболее простым при равенстве интервальных промежутков.

Для наглядности может строиться гистограмма частот (см. рис.3). Это – ступенчатая фигура, состоящая из прямоугольников с основаниями равными интервальным промежуткам и высотами равными плотностям относительных частот на каждом промежутке (отношение относительной частоты случайной величины на каждом интервале к интервальному промежутку – wi/ (хi-xi-1)).

Площадь такой гистограммы равна сумме относительных частот случайной величины, т.е. единице.

Для выборной совокупности по формуле Fn(х)=nx/n рассчитывается эмпирическая функция распределения или функция распределения выборки. Здесь n – объём выборки, а nx число вариант, для которых Х<x.

Функция распределения выборки Fn(х) отличается от теоретической функции распределения (функции распределения генеральной совокупности) F(х) тем, что первая определяет относительную частоту события, для которых Х<х, а вторая – вероятность того же события.

Например: требуется найти функцию распределения следующей выборки

варианты хi        
частоты ni        

Объём выборки: п=2+3+10+5=20.

Наименьшая варианта х1=6, поэтому для Х<6 функция распределения выборки Fn(х)=0/20=0. Для Х£8, Fn(х)=2/20=0,1; Х£12 – Fn(х)=5/20=0,25; Х£15 – Fn(х)=15/20=0,75. Наибольшая варианта х4=15, поэтому для Х>15 функция распределения выборки Fn(х)=20/20=1. График эмпирической функции распределения для этой выборки будет иметь следующий вид.

Рис.7 График функции распределения выборки дискретной случайной величины

 

По выборке можно судить о значении какого-либо параметра генеральной совокупности. Оценка исследуемого параметра будет качественной при условии, что она удовлетворяет требованиям несмещённости, состоятельности и эффективности.

Например, требуется оценить некоторый параметр a генеральной совокупности по выборке х1, х2, …, хп. Оценка этого параметра будет зависеть от значений х1, х2, …, хп и обозначаться: . Величина является случайной величиной, поэтому она характеризуется распределением и числовыми характеристиками распределения.

Оценка параметра a считается несмещённой, если её математическое ожидание, определённое по выборочной совокупности, равно истинному значению этого параметра: М ()= a и – смещённой при М (a.

Оценка параметра a является состоятельной, если по мере увеличения объёма выборки оценка будет приближаться к оцениваемому параметру с вероятностью, стремящейся к единице. Это означает, что при любом e>0 . Это равенство выполняется при условии, что .

Оценка параметра a является эффективной, если при заданном п она имеет наименьшую дисперсию D()= Dmin, т.е. средний квадрат ошибки данной оценки не превышает среднего квадрата ошибки при любой другой оценке: .

<== предыдущая лекция | следующая лекция ==>
Основные функции распределения | Доверительный интервал. Доверительная вероятность
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 186; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.