Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Предварительная обработка реализации выборки

Рассмотрим основные понятия, связанные с реализацией выборки. Пусть имеется реализация выборки объема n. Если упорядочить значения по возрастанию, то полученная цепочка чисел называется вариационным рядом.

Пусть xi – элемент вариационного ряда. Тогда число повторений этого элемента в реализации выборки называется частотой выборочного значения xi и обозначается ni. Величина называется относительной частотой значения xi.

Выделим очевидные равенства

, . (8.1)

Пусть x 1, x 2, …, xm – все различные значения вариационного ряда, упорядоченные по возрастанию. Таблица

 

x 1 x 2 xm
n 1 n 2 nm

 

называется статистическим рядом. Он в некотором смысле характеризует закон распределения г.с.

Теперь предположим, что объем выборки большой. В этом случае строят так называемый интервальный (или группированный) статистический ряд. Рассмотрим реализацию выборки x 1, x 2, …, xn объема n. Выбираем некоторый отрезок I (обычно это либо отрезок [min{ xi }, max{ xi }], либо чуть больший, чем он). Делим отрезок I точками z 0, z 1, …, zk. на равные частичные промежутки D 1=[ z 0, z 1[, D 2= [ z 1 z 2[, …, Dk =[ zk –1 zk ]. Здесь z 0 и zk – начало и конец отрезка I соответственно. Частотой ni i -го промежутка Di называется число значений реализации выборки, попавших в Di (i =1,2,…, k). Интервальным статистическим рядом называется таблица

D 1 D 2 Dk
n 1 n 2 nk

 

Проверьте, что для частот и относительных частот выполняется равенства (8.1).

Статистической (или эмпирической) функцией распределения называется

.

Теорема. Если F (x) – функция распределения г.с., то для любого действительного значения x и любого e >0 выполняется равенство

.

Смысл этой теоремы в том, что при больших объемах выборки значения статистической функции распределения является приближенными значениями функция распределения, т.е. статистическая функция распределения является оценкой неизвестной функция распределения г.с.

Для непрерывно распределенной г.с. наглядную оценку для плотности распределения дает гистограмма относительных частот.

Гистограмма относительных частот – это ступенчатая фигура, построенная следующим образом. На оси Ох откладываются частичные промежутки D 1,…, Dk. Над каждым из них строится прямоугольник с высотой n i / h, где h – длина частичного промежутка. Функция, график которой задается гистограммой относительных частот, также называется гистограммой относительных частот.

Вычислим площадь, «ограниченной» гистограммой.

.

Это аналог свойства нормировки плотности распределения. Оказывается, что гистограмма относительной частоты равна приближенно неизвестной плотности непрерывно распределенной г.с., т.е. гистограмма дает приближенно представление о виде плотности распределения г.с.

Пример 8.1. Дан интервальный статистический ряд

(1, 3) (3, 5) (5, 7) (7, 9) (9, 11)
         

 

Построить график статистической функции распределения и гистограмму относительных частот. Построить, соответственно, приближенные графики неизвестных функции и плотности распределения г.с.

Объем выборки n =100. Длина h частичного промежутка равна 2. Относительные частоты равны n 1=10/100=0.1, n 2=32/100=0.32, n 3=0.2, n 4=0.24, n 5=0.14.

Вычислим значения статистической функции распределения:

На рисунке 8.1 приведены график статистической функции распределения и приближенно график функции распределения.

F *(x) – статистическая функция распределения р (x) – плотность распределения F (x) – функция распределения Рисунок 8.1 Рисунок 8.2

Вычислим высоты прямоугольников гистограммы: 0.1/2=0.05, 0.32/2=0.16, 0.1,0.12, 0.07. На рисунке 8.2 приведены гистограмма относительной частоты и приближенный график плотности.

 

<== предыдущая лекция | следующая лекция ==>
Доверительный интервал для дисперсии нормально распределенной г.с | Основные понятия проверки статистических гипотез
Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 411; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.