КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Случайная величина. Закон распределения. Числовые характеристики
Определение случайной величины. Многие случайные события могут быть оценены количественно случайными величинами. Случайной называют такую величину, которая принимает значения в зависимости от стечения случайных обстоятельств. Случайными величинами являются: число больных на приеме у врача, число студентов в аудитории, число рождений в городе, продолжительность жизни отдельного человека, скорость молекулы, температура воздуха, погрешность в измерении какой-либо величины и др. Различают дискретные и непрерывные случайные величины. Случайная величина называется дискретной, если она принимает счетное множество значений: число букв на произвольной странице книги, энергия электрона в атоме, число волос на голове человека, число зерен в колосьях, число молекул в выделенном объеме газа и т. п. Непрерывная случайная величина принимает любые значения внутри некоторого интервала', температура тела, масса зерен в колосьях пшеницы, координата места попадания пули в цель (принимаем пулю за материальную точку) и др. Распределение дискретной случайной величины. Дискретная случайная величина считается заданной, если указаны ее возможные значения и соответствующие им вероятности. Обозначим дискретную случайную величину X, ее значения x1, x2,..., а вероятности -P(x j) = p1, P(x2) = р2 и т. д. Совокупность X и Р называется распределением дискретной случайной величины (табл. 1). Таблица 1
Так как все возможные значения дискретной случайной величины представляют полную систему, то сумма вероятностей равна единице: . (8) Здесь предполагается, что дискретная случайная величина имеет п значений. Выражение (8) называется условием нормировки. Числовые характеристики дискретной случайной величины. Во многих случаях, наряду с распределением случайной величины или вместо него, информацию об этих величинах могут дать числовые параметры, получившие название числовых характеристик случайной величины. Рассмотрим наиболее употребительные из них. Математическое ожидание (среднее значение) случайной величины есть сумма произведений всех возможных ее значений на вероятности этих значений: (9) Пусть при большом числе испытаний п дискретная случайная величина X принимает значения x1 x2,..., хп соответственно т1, т2,..., тп раз. Среднее значение равно Возможные значения дискретной случайной величины рассеяны вокруг ее математического ожидания, часть из них превышает М(Х), час меньше М(Х). Как оценить степень разброса случайной величины относительно ее среднего значения? Для этого целесообразно учитывать либо абсолютные значения отклонений М [Х - М (X)], либо их квадраты М[Х - М(Х)]2. Второй вариант оказывается предпочтительнее, так придем к понятию дисперсии случайной величины. Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания: D(X) = M[X-M{X)]2. Без вывода приведем удобную для вычисления дисперсии формулу D(X) = M(X2)-[M{X)]2. (10) Она означает, что дисперсия равна разности между мате: ческим ожиданием квадрата случайной величины X и квадратом ее математического ожидания. Как следует из (10), дисперсия имеет размерность квадрата размерности случайной величины. Для того чтобы оценивать рассеяние случайной величины в единицах той же размерности, вводят понятие среднего квадратического отклонения, под которым понимают квадратный корень из дисперсии: (11) Распределение и характеристики непрерывной случайной величины. Непрерывную случайную величину нельзя задать тем же законом распределения, что и дискретную. В этом случае поступают следующим образом. Пусть dP — вероятность того, что непрерывная случайная величина X принимает значения между х и х + dx. Очевидно, что чем больше интервал dx, тем больше и вероятность dP: dP ~ dx. Кроме того, вероятность должна зависеть и от самой случайной величины, вблизи которой расположен интервал, поэтому dP = f(x)dx, (12) где f(x) — плотность вероятности, или функция распределе ния вероятностей. Она показывает, как изменяется вероятность, отнесенная к интервалу dx: случайной величины, в зависимости от значения самой этой величины: f(x) = dP/dx. (13) Интегрируя выражение (12) в соответствующих пределах, находим вероятность того, что случайная величина принимает какое-либо значение в интервале (аЬ): РаЬ = (14) Для непрерывной случайной величины математическое ожидание и дисперсия записываются соответственно в виде Нормальный закон распределения В теории вероятностей и математической статистике, важную роль играет нормальный закон распределения (закон Гаусса). Случайная величина распределена по этому закону, если плотность вероятности ее имеет вид где а = М(Х) — математическое ожидание случайной величины; — среднее квадратическое отклонение; следовательно, - дисперсия случайной величины. Кривая нормального закона распределения имеет колоколообразную форму (рис.1), симметричную относительно прямой (центр рассеивания). В точке х = а функция достигает максимума По мере возрастания \х - а\ функция f(x) монотонно убывает, асимптотически приближаясь к нулю. С уменьшением а кривая становится все более и более островершинной. Изменение а при постоянной не влияет на форму кривой, а лишь сдвигает ее вдоль оси абсцисс. Площадь, заключенная под кривой, согласно условию нормировки, равна единице. На рисунке 1 изображены три кривые. Для кривых 1 и 2 а = 0, эти кривые отличаются значением кривая 3 имеет а 0 (). Рис. 1. Математическая статистика — наука о математических методах систематизации и использования статистических данных для решения научных и практических задач. тематическая статистика тесно примыкает к теории вероятности и базируется на ее понятиях. Однако главным в математической статистике является не распределение случайных величин, а анализ статистических данных и выяснение, какому распределению они соответствуют. Большая статистическая совокупность, из которой отбирается часть объектов для исследования, называется генеральной совокупностью, а множество объектов, отобранных из нее, — выборочной совокупностью, или выборкой. Свойство объектов выборки должно соответствовать свойству объектов генеральной совокупности, или, как принято говорить выборка должна быть представительной (репрезентативной) Так, например, если целью является изучение состояния здровья населения большого города, то нельзя воспользоваться боркой населения, проживающего в одном из районов города. Условия проживания в разных районах могут отличаться (различная влажность, наличие предприятий, жилищных строений и.т.п. и, таким образом, влиять на состояние здоровья. Поэтому выборка должна представлять случайно отобранные объекты. Если записать в последовательности измерений все значения величины х в выборке, то получим простой статистический ряд. Например, рост мужчин (см): 171, 172, 172, 168, 170, 169,.... Такой ряд неудобен для анализа, так как в нем нет последовательности возрастания (или убывания) значений, встречаются и повторяющиеся величины. Поэтому целесообразно ранжировать ряд, например, в возрастающем порядке значений и указать их повторяемость. Получим статистическое распределение выборки: Здесь xi — наблюдаемые значения признака (варианта); ni — число наблюдений варианты хi (частота); рi* — относительная частота. Общее число объектов в выборке (объем выборки) . всего k вариант. Статистическое распределение — это совокупность вариант и соответствующих им частот (или относительных частот), т. е. это совокупность данных. В медицинской литературе статистическое распределение, состоящее из вариант и соответствующих им частот, получило название вариационного ряда. Наряду с дискретным (точечным) статистическим распределением, которое было описано, используют непрерывное (интервальное) статистическое распределение. Интервальная оценка генеральной средней. Точечная оценка, особенно при малой выборке, может значительно отличаться от истинных параметров генеральной совокупности. Поэтому при небольшом объеме выборки пользуются интервальными оценками. В этом случае указывается интервал (доверительный интервал, или доверительные границы), в котором с определенной (доверительной) вероятностью р находится генеральная средняя. Интервальная оценка генеральной средней при малой выборке. При достаточно большом объеме выборки можно сделать вполне надежные заключения о генеральной средней. Однако на практике часто имеют дело с выборками небольшого объема (п < 30). В этом случае в выражении доверительного интервала точность оценки определяется по следующей формуле: где t — параметр, называемый коэффициентом Стьюдента (его находят из распределения Стьюдента; оно здесь не рассматривается), который зависит не только от доверительной вероятности р, но и от объема выборки п. Коэффициент Стьюдента можно найти из табл. 2. Таблица 2
Интервальная оценка истинного значения измеряемой величины. Интервальная оценка генеральной средней может быть использована для оценки истинного значения измеряемой величины. Пусть несколько раз измеряют одну и ту же физическую величину. При этом по разным случайным причинам, вообще говоря, получают разные значения: xv x2, х3,.... Будем считать, что нет преобладающего влияния какого-либо фактора на эти измерения. Истинное значение измеряемой величины (хист) совершенно точно измерить невозможно хотя бы по причине несовершенства измерительных приборов. Однако можно дать интервальную оценку для этого значения. Если значения xv x2, х3,... рассматривать как варианты выборки, а истинное значение измеряемой величины хист как аналог генеральной средней, то можно по описанным выше правилам найти доверительный интервал, в который с доверительной вероятностью р попадает истинное значение измеряемой величины. Применительно к малому числу измерений (п < 30) получим:
где — среднее арифметическое значение из полученных измерений, а — соответствующее им среднее квадратическое отклонение, t — коэффициент Стьюдента. Более подробно и разносторонне оценка результатов измерений рассматривается в практикуме.
Дата добавления: 2013-12-13; Просмотров: 1084; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |