Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Гистограмма. Эмпирическое распределение результатов наблюдений

 

 

Чтобы получить представление о законе распределения измеряемой величины, экспериментальные данные группируют. Для этого весь интервал значений вели­чины от x min до x max (рис. 4.4) разбивают на несколько равных отрезков, называемых интервалами группировки данных, шириной Δ и центрами xk, так что k -й интервал (k = 1, 2, …, K) имеет границы (xk – Δ / 2, xk + Δ / 2). Далее распределяют значения xi по интервалам. Число точек Nk, оказавшихся внутри k -го интервала, даёт число попаданий измеряемой величины в этот интервал. Общее число точек, оказавшихся внутри всех интервалов разбиения, долж­но быть равно полному числу N результатов наблюдений в исходной выборке.

Над каждым интервалом Δk строится прямоугольник высотой fk = Nk / (N Δ). Совокупность таких прямоугольников называется гистограммой (рис. 4.4).

При построении гистограмм интервалы разбиения не следует брать очень большими или очень маленькими. Так, в первом случае прямоугольники на гистограмме будут иметь примерно одинаковую высоту, а во втором – могут появиться интервалы, в которые не попадет ни одного значения случайной величины. Чтобы этого не происходило, придерживаются следующих правил:

  • Число интервалов группировки данных К рассчитывают по формуле К = 1 + 3.2 lg N, где N – объем выборки.
  • Если число К получается дробным, то eго округляют до ближайшего меньшего целого. Ширину интервалов берут равной Δ = (x maxx min)/ K.

Высоты и площади прямоугольников на гистограмме имеют следующий смысл. Поскольку относительные частоты Pk = Nk / N приближенно равны вероятности попадания результата каждого отдельного наблюдения в данный интервал, то высота каждого прямоугольника на гистограмме

fk = Nk / N Δ = Рk

есть вероятность, приходящаяся на единицу длины интервала разбиения или плотность вероятности попадания случайной величины в интервал Δ k с центром в точке xk.

Площадь каждого прямоугольника fk Δ = Nk / N = Рk есть вероятность попадания результата в интервал Δ k. Сумма площадей прямоугольников, основания которых находятся внутри некоторого интервала [ x 1, x 2], равна вероятности для каждого отдельного наугад взятого результата попасть в этот интервал.

Нетрудно убедиться, что сумма площадей всех прямоугольников равна единице:

. (4.1)

Это означает, что попадание произвольного результата наблюдения в какой-либо из интервалов разбиения в промежутке ( x max, x min) есть достоверное событие.

Из рис. 4.4 видно, что результаты наблюдений распределены около некоторого значения, абсцисса которого соответствует цен­тру самого высокого прямоугольника на гистограмме. По обе стороны данного прямоугольника расположены прямоугольники убывающих высот и площа­дей. Учитывая, что высоты прямоугольников fk имеют смысл плотности вероятности попадания измеряемой величины в интервал Δ k, можно сказать, что гистограмма дает представление о законе распределения измеряемой величины.

Зная координаты центров интервалов разбиения xk и количества попаданий Nk значений измеряемой величины в интервалы, можно найти среднее значение измеряемой величины и величину , характеризующую разброс результатов наблюдений около среднего значения:

(4.2)

(4.3)

где при большом объеме выборки . Величину называют эмпирической дисперсией, а среднеквадратическим отклонением результатов наблюдений от среднего (СКО x) этот параметр характеризует ширину распределения значений случайной величины около среднего значения.

Если число наблюдений взять очень большим (), т. е. от выборки перейти к генеральной совокупности, а ширины интервалов разбиения очень маленькими, то ломаная огибающая гистограммы перейдет в плавную кривую, называемую функцией плотности распределения вероятности измеряемой величины, которую будем обозначать f (x). В этом случае суммы (4.1)–(4.3) заменятся интегралами, а вероятности Pk – вероятностями попадания случайной величины в интервал (). Если случайная величина распределена в интервале (a, b) (заметим, что границы интервала могут быть и бесконечными: ), то выражения (4.1)–(2.4) будут иметь вид

(4.4)

(4.5)

, (4.6)

где есть плотность вероятности распределения случайной величины или просто плотность вероятности; , – генеральные среднее и дисперсия.

Равенство (4.4) называют условием нормировки функции плотности вероятности. Это условие требует, чтобы площадь под графиком функции вероятности всегда была равна единице.

 

Закон распределения непрерывной случайной величины - соби­рательный термин, используемый для обозначения способов матема­тического описания непрерывной случайной величины. Закон рас­пределения может быть задан функцией распределения F(х) как уни­версальной характеристикой описания любых случайных величин и (или) плотностью распределения w(x), которая существует только для непрерывных случайных величин. Функции F(х) и w(x) несут о непрерывной случайной величине одну и ту же информацию, но в разной форме. Для их определе­ния необходимо проведение весьма длительных и кропотливых исследований и вычислений.

В большинстве случаев бывает дос­таточно охарактеризовать случайные величины с помощью ограниченного числа специальных параметров, основными из ко­торых являются:

• центр распределения;

• начальные и центральные моменты и производные от них ко­эффициенты – математическое ожидание (МО), Среднее квадратическое отклонение(СКО), эксцесс, контрэксцесс и коэффициент асимметрии.

<== предыдущая лекция | следующая лекция ==>
Случайная величина. Закон распределения | Случайное событие. Частота. Вероятность
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 1339; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.