КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Другие числовые характеристики выборки
Варианты. Вариационный ряд Первичная обработка результатов Небольшой объем выборки (n<25) Пусть интересующая нас случайная величина Х принимает в выборке значение х 1 - п 1 раз, х 2 – п 2 раз, …, хк – пк раз, причем где п – объем выборки. Тогда наблюдаемые значения случайной величины х 1, х 2,…, хк называют вариантами (иногда – дискретами), а п 1, п 2,…, пк – частотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты: Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, который может быть представлен также в виде таблицы с перечнем вариант и соответствующих им частот или относительных частот:
Пример. При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1. Здесь n =20. Составим вариационный ряд: 0,0,0,1,1,1,1,1,1,2,2,2,2,2,3,3,3,4,4,5. Или в виде таблицы:
Большой объем выборки (n≥25) При большом объеме выборки вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку, то есть выборку по интервалам. Её суть состоит в том, что весь объем выборки разбивается на интервалы, рассчитывается ширина интервала (обычно она одинакова для всех интервалов), и дальнейшая обработка вариант идёт по интервалам. 1. Выбор количества интервалов k, которое зависит от числа вариант n. Два способа: а) по формуле Стерджеса: ; (1.1)
б) по таблице:
(1.2) 3. Определение левой границы первого интервала: (1.3)
4. Определение правой границы первого интервала, она же равна левой границе второго интервала: . (1.4) 5. Аналогично производится расчёт границ всех интервалов:.
(1.5)
7. Вычисление частот интервалов: подсчитывается, сколько вариант находится в каждом интервале: n1, n2,…nk. Причем n1+n2+…+nk=n. Этот шаг делается после ранжирования – расположения вариант по возрастанию. 8. Определение относительных частот (частостей) интервалов: . (1.6)
Относительная частота в математической статистике играет роль вероятности, поэтому сумма относительных частот должна быть равна 1. В случае группированной выборки получаем интервальный вариационный ряд:
1.3.2. Полигон частот. Гистограмма. Эмпирическая функция распределения Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x 1, n 1), (x 2, n 2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат (рис.1.1). Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот.
Заметим, что в случае интервального вариационного ряда по оси ординат откладываются срединные значения интервалов. Другим видом графиков является гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы длиной h, а высотами – отрезки длиной ni/h (гистограмма частот на рис.1.2) или wi/h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице.
Площадь каждого прямоугольника гистограммы пропорциональна частоте (или относительной частоте) попадания случайной величины в данный интервал. Величина n/h называется плотностью частоты. Но вид гистограммы не изменится, если вместо плотности частоты по оси ординат отложить саму частоту (или относительную частоту). Гистограмма по своей сути и способу построения ближе всего к дифференциальной функции распределения f(x) (закону распределения вероятностей, а точнее – плотности распределения вероятностей), широко применяющейся в теории вероятностей. Но в теории вероятностей применяется и интегральная функция распределения случайной величины. По аналогии с ней можно задать эмпирическую функцию распределения. Эмпирической функцией распределения называют функцию F* (x), определяющую для каждого значения х относительную частоту события X < x (события, что варианта X примет значение меньшее конкретного значения x). Таким образом, , (1.7) где пх – число вариант, меньших х, п – объем выборки. Замечание. В отличие от эмпирической функции распределения F* (x), найденной опытным путем, функцию распределения F (x) генеральной совокупности называют теоретической функцией распределения. F (x) определяет вероятность события X < x, а F* (x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F* (x) стремится по вероятности к F (x). Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F (x), а именно: 1) 0 ≤ F* (x) ≤ 1. 2) F* (x) – неубывающая функция. 3) Если х 1 – наименьшая варианта, то F* (x) = 0 при х ≤ х 1; если хк – наибольшая варианта, то F* (x) = 1 при х > хк. При нахождении F* (x) (числителя в формуле (1.7)) для каждого интервала суммируют частоты всех предыдущих интервалов (они называются накопленными частотами):
В итоге вид F* (x) будет подобен интегральной функции распределения для дискретной случайной величины:
Кроме рассмотренных, можно найти также следующие величины: моду; медиану; среднее арифметическое выборки (выборочное среднее) (1.8) (1.9) где среднее арифметическое каждого интервала, - частота каждого интервала, k – количество интервалов.
Дата добавления: 2013-12-13; Просмотров: 1049; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |