Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Другие числовые характеристики выборки


Доверь свою работу кандидату наук!
1500+ квалифицированных специалистов готовы вам помочь

Варианты. Вариационный ряд

Первичная обработка результатов

Небольшой объем выборки (n<25)

Пусть интересующая нас случайная величина Х принимает в выборке значение х1 - п1 раз, х2п2 раз, …, хк – пк раз, причем где п – объем выборки.

Тогда наблюдаемые значения случайной величины х1, х2,…, хк называют вариантами (иногда – дискретами), а п1, п2,…, пкчастотами.

Если разделить каждую частоту на объем выборки, то получим относительные частоты: Последовательность вариант, записанных в порядке возрастания, называют вариационным рядом, который может быть представлен также в виде таблицы с перечнем вариант и соответствующих им частот или относительных частот:

 

xi x1 x2 xk
ni n1 n2 nk
wi w1 w2 wk

 

Пример.

При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1. Здесь n=20.

Составим вариационный ряд: 0,0,0,1,1,1,1,1,1,2,2,2,2,2,3,3,3,4,4,5.

Или в виде таблицы:

xi
ni
wi= 0,15 0,3 0,25 0,15 0,1 0,05

 

Большой объем выборки (n≥25)

При большом объеме выборки вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку, то есть выборку по интервалам. Её суть состоит в том, что весь объем выборки разбивается на интервалы, рассчитывается ширина интервала (обычно она одинакова для всех интервалов), и дальнейшая обработка вариант идёт по интервалам.

1. Выбор количества интервалов k, которое зависит от числа вариант n. Два способа:

а) по формуле Стерджеса: ; (1.1)

 

б) по таблице:

n 25-40 41-60 61-100 101-200 >200
k 5-6 6-8 7-10 8-10 10-15

 



2. Расчёт ширины h интервала:

(1.2)

3. Определение левой границы первого интервала:

(1.3)

 

4. Определение правой границы первого интервала, она же равна левой границе второго интервала:

. (1.4)

5. Аналогично производится расчёт границ всех интервалов:.

 
6. Расчёт срединных значений интервалов, которые отстоят от левых границ интервала на величину, равную половине ширины интервалов:

 

(1.5)

 

7. Вычисление частот интервалов: подсчитывается, сколько вариант находится в каждом интервале: n1, n2,…nk . Причем n1+n2+…+nk=n . Этот шаг делается после ранжирования – расположения вариант по возрастанию.

8. Определение относительных частот (частостей) интервалов:

 
 


. (1.6)

 

Относительная частота в математической статистике играет роль вероятности, поэтому сумма относительных частот должна быть равна 1.

В случае группированной выборки получаем интервальный вариационный ряд:

xi x1 x2 x3 xk
ni n1 n2 n3 nk
wi= w1 w2 w3   wk

1.3.2. Полигон частот. Гистограмма. Эмпирическая функция распределения

Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат (рис.1.1). Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот.

 

 

 

Заметим, что в случае интервального вариационного ряда по оси ординат откладываются срединные значения интервалов.

Другим видом графиков является гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы длиной h, а высотами отрезки длиной ni/h (гистограмма частот на рис.1.2) или wi/h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице.

 


 

Площадь каждого прямоугольника гистограммы пропорциональна частоте (или относительной частоте) попадания случайной величины в данный интервал.

Величина n/h называется плотностью частоты.

Но вид гистограммы не изменится, если вместо плотности частоты по оси ординат отложить саму частоту (или относительную частоту).

Гистограмма по своей сути и способу построения ближе всего к дифференциальной функции распределения f(x) (закону распределения вероятностей, а точнее – плотности распределения вероятностей), широко применяющейся в теории вероятностей.

Но в теории вероятностей применяется и интегральная функция распределения случайной величины. По аналогии с ней можно задать эмпирическую функцию распределения.

Эмпирической функцией распределения называют функцию F*(x), определяющую для каждого значения х относительную частоту события X < x (события, что варианта X примет значение меньшее конкретного значения x). Таким образом,

, (1.7)

где пх – число вариант, меньших х, п – объем выборки.

Замечание. В отличие от эмпирической функции распределения F*(x), найденной опытным путем, функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. F(x) определяет вероятность события X < x, а F*(x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F*(x) стремится по вероятности к F(x).

Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно:

1) 0 ≤ F*(x) ≤ 1.

2) F*(x) – неубывающая функция.

3) Если х1 – наименьшая варианта, то F*(x) = 0 при хх1; если хк – наибольшая варианта, то F*(x) = 1 при х > хк .

При нахождении F*(x) (числителя в формуле (1.7)) для каждого интервала суммируют частоты всех предыдущих интервалов (они называются накопленными частотами):



Номер интервала k
Накопленные частоты nx n1 n1+n2 n1+n2+n3 n1+n2+n3+…nk=n

В итоге вид F*(x) будет подобен интегральной функции распределения для дискретной случайной величины:

 
 

 

 


Кроме рассмотренных, можно найти также следующие величины: моду; медиану; среднее арифметическое выборки (выборочное среднее)

а) для выборки малого объема:

(1.8)

б) в случае интервального вариационного ряда:

(1.9)

где среднее арифметическое каждого интервала, - частота каждого интервала, k – количество интервалов.

Поможем в написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой
<== предыдущая лекция | следующая лекция ==>
Генеральная совокупность и выборка. Виды выборок | Выборочное среднее квадратическое отклонение (СКО)

Дата добавления: 2013-12-13; Просмотров: 964; Нарушение авторских прав?;


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



ПОИСК ПО САЙТУ:


Читайте также:

  1. III. ПРЕДУПРЕЖДЕНИЕ, СОТРУДНИЧЕСТВО И ДРУГИЕ МЕРЫ
  2. III.2. Сознание человека и его характеристики.
  3. Pn - карта - число дефектных деталей при фиксированном объеме выборки.
  4. XVI.3. Качественная и количественная характеристики способностей.
  5. Антропометрические характеристики человека
  6. Антропометричні та морфологічні характеристики чоловіків та жінок
  7. Аудиторская выборка (ФСА № 16). Оценка результатов аудиторской выборки. Репрезентативность выборки
  8. АЦП и его характеристики
  9. Базовые характеристики исторической типологии городов.
  10. Біомеханічні характеристики
  11. В добывающей промышленности (где получают энергоносители, полезные ископаемые и другие сырьевые продукты) рента образуется совершенно так же, как и в земледелии.
  12. Ввести переменные величины , числовые значения которых однозначно определяют одно из возможных состояний исследуемого явления.

studopedia.su - Студопедия (2013 - 2022) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.035 сек.