КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Ранжирование
Статистическое распределение выборки. Предмет математической статистики 23. Генеральная и выборочная совокупности
генеральная совокупность — это с. в. Х(ω), заданная на пространстве элементарных событий Ώ, с выделенным в нем классом S подмножеств событий, для которых указаны их вероятности. выборка — это последовательность Х1, Х2,…, Хn независимых одинаково распределенных с.в., распределение каждой из которых совпадает с распределением генеральной случайной величины. х1, х2,…,хп. репрезентативной Пример1. Десять абитуриентов проходят тестирование по математике. Каждый из них может набрать от 0 до 5 баллов включительно. Пусть Xk — количество баллов, набранных k-м (к = 1,2,..., 10) абитуриентом. Тогда значения 0, 1, 2, 3, 4, 5 — все возможные количества баллов, набранных одним абитуриентом, — образуют генеральную совокупность. Выборка Х1,Х2,…, Х10 — результат тестирования 10 абитуриентов. Реализациями выборки могут быть следующие наборы чисел: {5, 3, 0, 1, 4, 2, 5, 4, 1, 5} или {4, 4, 5, 3, 3, 1, 5, 5, 2, 5} или {3, 4, 5, 0, 1, 2, 3, 4, 5, 4} и т.д. Эмпирическая функция распределения. св. X. Пусть она приняла n1 раз значение x1, n2 раз — значение x2, …, nk раз — значение xk. При этом n1 + n2 +…+ nk =n— объем выборки. Значения x1, x2, …, xk называют вариантами св. X.
Полученная таким образом последовательность x (1), x (2), …, x (n) (где x (1) £ x (2) £ …£ x (n) и x (1) =,…, x (n) =) называется вариационным рядом. Числа ni, xi р i *-частности (56), где n= Пример 2. В результате тестирования (см. пример 6.1) группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда; б) статистического ряда. а) Проранжировав статистические данные (т. е. исходный ряд), получим вариационный ряд (x (1), x (2), …, x (10)): (0, 1, 1, 2, 3, 4, 4, 5, 5, 5). б) Подсчитав частоту и частость вариантов x 1 =0, x 2 =1, x 3 =2, x 4 =3, x 5 = 4, x 6 =5, получим статистическое распределение выборки) (так называемый дискретный статистический ряд)
или
Статистическое распределение выборки является оценкой неизвестного распределения. рi* n → ∞ рi, рi*рi. n [x0, x1), [x1, x2), …, [xk-1, xk), h = x1 – x0 = х2 — x1 =.... Для определения величины интервала (h) можно использовать формулу Стерджеса: (57) где хmах—xmin — разность между наибольшим и наименьшим значениями признака, m= 1 + log2 n — число интервалов (log2 n ≈ 3,322 lg n). За начало первого интервала рекомендуется брать величину xнач = xmin—. Во второй строчке статистического ряда вписывают количество наблюдений ni (i =1,…,k), попавших в каждый интервал. Пример 3. Измерили рост (с точностью до см) 30 наудачу отобранных студентов. Результаты измерений таковы: 178, 160, 154, 183, 155, 153, 167, 186, 163, 155, 157, 175, 170, 166, 159, 173, 182, 167, 171, 169, 179, 165, 156, 179, 158, 171, 175, 173, 164, 172. Построить интервальный статистический ряд. Для удобства проранжируем полученные данные: 153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165. 166. 167, 167, 169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186. Отметим, что X — рост студента — непрерывная с. в. При более точном измерении роста значения с. в. X обычно не повторяются (вероятность наличия на Земле двух человек, рост которых равен, скажем = 1,732050808... метров, равна нулю!). хтiп = 153, хmах = 186; по формуле Стерджеса, при п = 30, находим длину частичного интервала h = 6. Тогда хнач = 153-= 150. Исходные данные разбиваем на 6 (т = 1 + log230 = 5,907 ≈ 6) интервалов: [150,156), [156,162), [162,168), [168,174), [174, 180), [180, 186). Подсчитав число студентов (ni), попавших в каждый из полученных промежутков, получим интервальный статистический ряд:
Эмпирической (статистической) функцией распределения называется функция Fn* (х), определяющая для каждого значения х частость события {X < х}: Fn* (х)=p*{X<x}. (58) Для нахождения значений эмпирической функции удобно Fn* (х) писать в виде
Fn* (х)= (59), где n — объем выборки, nх — число наблюдений, меньших x (x Î R) п события {X < х} Fn* (х) является оценкой вероятности события {X < х} Теорема1. (Гливенко). Пусть F(x) — теоретическая функция распределения с.в. X, а Fn* (х) — эмпирическая. Тогда для любого e > 0 lim { |Fn*(х) - F(x)|>e} = 0. Пример 4. Построить функцию Fn* (х), используя условие и результаты примера 2. Здесь п = 10. Имеем F*10(x) = = 0 при х£ 0 (наблюдений меньше 0 нет); F*10(x) = при 0 < х£ 1 (здесь
nх=1) и т. д. Окончательно получаем
График эмпирической функции распределения приведен на рис.
Дата добавления: 2014-01-06; Просмотров: 4370; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |