Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Ранжирование




Статистическое распределение выборки.

Предмет математической статистики

23. Генеральная и выборочная совокупности

 

генеральная совокупность — это с. в. Х(ω), заданная на пространстве элементарных событий Ώ, с выделенным в нем классом S подмножеств событий, для которых указаны их вероятности.

выборка — это последовательность Х1, Х2,…, Хn независимых одинаково распределенных с.в., распределение каждой из которых совпадает с распределением генеральной случайной величины.

х1, х2,…,хп.

репрезентативной

Пример1. Десять абитуриентов проходят тестирование по матема­тике. Каждый из них может набрать от 0 до 5 баллов включительно. Пусть Xk — количество баллов, набранных k-м (к = 1,2,..., 10) аби­туриентом.

Тогда значения 0, 1, 2, 3, 4, 5 — все возможные количества бал­лов, набранных одним абитуриентом, — образуют генеральную сово­купность.

Выборка Х12,…, Х10 — результат тестирования 10 абитури­ентов.

Реализациями выборки могут быть следующие наборы чисел: {5, 3, 0, 1, 4, 2, 5, 4, 1, 5} или {4, 4, 5, 3, 3, 1, 5, 5, 2, 5} или {3, 4, 5, 0, 1, 2, 3, 4, 5, 4} и т.д.

Эмпирическая функция распределения.

св. X.

Пусть она приняла n1 раз значение x1,

n2 раз — значение x2,

…,

nk раз — значение xk.

При этом n1 + n2 +…+ nk =n— объем выборки. Значения x1, x2, …, xk называют вариантами св. X.

 

Полученная таким образом последовательность

x (1), x (2), …, x (n) (где x (1) £ x (2) £ …£ x (n) и x (1) =,…, x (n) =) называется вариационным рядом.

Числа ni, xi

р i *-частности (56), где n=

Пример 2. В результате тестирования (см. пример 6.1) группа аби­туриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда; б) статистического ряда.

а) Проранжировав статистические данные (т. е. исходный ряд), получим вариационный ряд (x (1), x (2), …, x (10)):

(0, 1, 1, 2, 3, 4, 4, 5, 5, 5).

б) Подсчитав частоту и частость вариантов x 1 =0, x 2 =1, x 3 =2, x 4 =3, x 5 = 4, x 6 =5, получим статистическое распределение выборки) (так называемый дискретный статистический ряд)

 

x i            
ni            

 

или

 

x i            
рi*

 

 

Статистическое распределение выборки является оценкой неизвестного распределения.

рi* n → ∞ рi, рi*рi. n

[x0, x1), [x1, x2), …, [xk-1, xk),

h = x1 – x0 = х2 — x1 =....

Для определения величины интервала (h) можно использовать формулу Стерджеса:

(57)

где хmах—xmin — разность между наибольшим и наименьшим значени­ями признака, m= 1 + log2 n — число интервалов (log2 n ≈ 3,322 lg n). За начало первого интервала рекомендуется брать величину xнач = xmin. Во второй строчке статистического ряда вписывают количество наблюдений ni (i =1,…,k), попавших в каждый интервал.

Пример 3. Измерили рост (с точностью до см) 30 наудачу отобран­ных студентов. Результаты измерений таковы:

178, 160, 154, 183, 155, 153, 167, 186, 163, 155,

157, 175, 170, 166, 159, 173, 182, 167, 171, 169,

179, 165, 156, 179, 158, 171, 175, 173, 164, 172.

Построить интервальный статистический ряд.

Для удобства проранжируем полученные данные:

153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165. 166. 167, 167, 169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Отметим, что X — рост студента — непрерывная с. в. При более точном измерении роста значения с. в. X обычно не повторяются (веро­ятность наличия на Земле двух человек, рост которых равен, скажем = 1,732050808... метров, равна нулю!).

хтiп = 153, хmах = 186; по формуле Стерджеса, при п = 30, находим длину частичного интервала

h = 6. Тогда хнач = 153-= 150. Исходные данные

разбиваем на 6 (т = 1 + log230 = 5,907 ≈ 6) интервалов: [150,156), [156,162), [162,168), [168,174), [174, 180), [180, 186).

Подсчитав число студентов (ni), попавших в каждый из полученных промежутков, получим интервальный статистический ряд:

Рост [150-156) [156-162) [162-168) [168-174) [174-180) [180-186)
Частота            
Частость 0,13 0,17 0,20 0,23 0,17 0,10

Эмпирической (статистической) функцией распределения называется функция Fn* (х), определяющая для каждого значения х частость события {X < х}:

Fn* (х)=p*{X<x}. (58)

Для нахождения значений эмпирической функции удобно Fn* (х) писать в виде

 

Fn* (х)= (59), где n — объем выборки, nх — число наблюдений, меньших x (x Î R)

п события {X < х}

Fn* (х) является оценкой вероятности события {X < х}

Теорема1. (Гливенко). Пусть F(x) — теоретическая функция рас­пределения с.в. X, а Fn* (х) — эмпирическая. Тогда для любого e > 0

lim { |Fn*(х) - F(x)|>e} = 0.

Пример 4. Построить функцию Fn* (х), используя условие и результаты примера 2.

Здесь п = 10. Имеем F*10(x) = = 0 при х£ 0 (наблюдений меньше 0 нет); F*10(x) = при 0 < х£ 1 (здесь

x i            
рi*

nх=1) и т. д. Окончательно получаем

 

График эмпирической функции распределения приведен на рис.

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 4315; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.