![]() КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Другие числовые характеристики выборки
Варианты. Вариационный ряд Первичная обработка результатов Небольшой объем выборки (n<25) Пусть интересующая нас случайная величина Х принимает в выборке значение х1 - п1 раз, х2 – п2 раз, …, хк – пк раз, причем Тогда наблюдаемые значения случайной величины х1, х2,…, хк называют вариантами (иногда – дискретами), а п1, п2,…, пк – частотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты:
Пример. При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1. Здесь n=20. Составим вариационный ряд: 0,0,0,1,1,1,1,1,1,2,2,2,2,2,3,3,3,4,4,5. Или в виде таблицы:
Большой объем выборки (n≥25) При большом объеме выборки вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку, то есть выборку по интервалам. Её суть состоит в том, что весь объем выборки разбивается на интервалы, рассчитывается ширина интервала (обычно она одинакова для всех интервалов), и дальнейшая обработка вариант идёт по интервалам. 1. Выбор количества интервалов k, которое зависит от числа вариант n. Два способа: а) по формуле Стерджеса:
б) по таблице:
(1.2) 3. Определение левой границы первого интервала:
(1.3)
4. Определение правой границы первого интервала, она же равна левой границе второго интервала:
5. Аналогично производится расчёт границ всех интервалов:
(1.5)
7. Вычисление частот интервалов: подсчитывается, сколько вариант находится в каждом интервале: n1, n2,…nk . Причем n1+n2+…+nk=n . Этот шаг делается после ранжирования – расположения вариант по возрастанию. 8. Определение относительных частот (частостей) интервалов:
. (1.6)
Относительная частота в математической статистике играет роль вероятности, поэтому сумма относительных частот должна быть равна 1. В случае группированной выборки получаем интервальный вариационный ряд:
1.3.2. Полигон частот. Гистограмма. Эмпирическая функция распределения
Заметим, что в случае интервального вариационного ряда по оси ординат откладываются срединные значения интервалов. Другим видом графиков является гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы длиной h, а высотами – отрезки длиной ni/h (гистограмма частот на рис.1.2) или wi/h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице.
Площадь каждого прямоугольника гистограммы пропорциональна частоте (или относительной частоте) попадания случайной величины в данный интервал. Величина n/h называется плотностью частоты. Но вид гистограммы не изменится, если вместо плотности частоты по оси ординат отложить саму частоту (или относительную частоту). Гистограмма по своей сути и способу построения ближе всего к дифференциальной функции распределения f(x) (закону распределения вероятностей, а точнее – плотности распределения вероятностей), широко применяющейся в теории вероятностей. Но в теории вероятностей применяется и интегральная функция распределения случайной величины. По аналогии с ней можно задать эмпирическую функцию распределения. Эмпирической функцией распределения называют функцию F*(x), определяющую для каждого значения х относительную частоту события X < x (события, что варианта X примет значение меньшее конкретного значения x). Таким образом,
где пх – число вариант, меньших х, п – объем выборки. Замечание. В отличие от эмпирической функции распределения F*(x), найденной опытным путем, функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. F(x) определяет вероятность события X < x, а F*(x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F*(x) стремится по вероятности к F(x). Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно: 1) 0 ≤ F*(x) ≤ 1. 2) F*(x) – неубывающая функция. 3) Если х1 – наименьшая варианта, то F*(x) = 0 при х≤ х1; если хк – наибольшая варианта, то F*(x) = 1 при х > хк . При нахождении F*(x) (числителя в формуле (1.7)) для каждого интервала суммируют частоты всех предыдущих интервалов (они называются накопленными частотами):
В итоге вид F*(x) будет подобен интегральной функции распределения для дискретной случайной величины:
Кроме рассмотренных, можно найти также следующие величины: моду; медиану; среднее арифметическое выборки (выборочное среднее)
(1.8)
(1.9) где Поможем в написании учебной работы
Дата добавления: 2013-12-13; Просмотров: 964; Нарушение авторских прав?; Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
Читайте также:
|