КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Основные понятия математической статистики 1 страница
МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ИЗУЧЕНИЮ ДИСЦИПЛИНЫ
В математической статистике принято выделять два основных направления исследований: первое направление связано с оценкой неизвестных параметров, второе – с проверкой некоторых априорных предположений или статистических гипотез. Основными понятиями математической статистики являются: генеральная совокупность, выборка, эмпирическая функция распределения. Генеральная совокупность – это случайная величина или случайный вектор, заданный на вероятностном пространстве событий. Исследование всех элементов генеральной совокупности невозможно и нецелесообразно, так как объём элементов очень велик, и обработка стоит большого труда. Поэтому из генеральной совокупности отбирают определённое количество элементов, которые называются выборкой, и производят их изучение. Элементы выборки называют вариантами. Чтобы по данным выборки можно было судить об интересующем признаке генеральной совокупности, все объекты должны иметь одинаковую вероятность попадания в выборку, т.е. выборка должна быть репрезентативной. И тогда, в соответствии с законом больших чисел, результаты выборки будут близки к результатам, которые могут быть получены при наблюдении всех объектов генеральной совокупности. Способ составления выборки может быть повторным, если один и тот же объект генеральной совокупности попадает под наблюдение более одного раза, в противном случае способ составления выборки называется бесповторным. Если объём выборки достаточно велик, то существенной разницы между бесповторной и повторной выборками нет. Среди этих двух основных способов различают следующие способы составления выборки: механический, при котором объекты отбирают через определённый интервал (например, каждое десятое изделие с конвейера); простойслучайный, при котором объекты отбирают случайно (например, каждый объект заменяют жетоном с номером, жетоны перемешивают и случайным образом берут несколько штук, а затем по ним берут объекты); типический, при котором объекты генеральной совокупности разбивают на непересекающиеся группы, а из них случайным образом берут объекты; серийный, при котором объекты разбивают на непересекающиеся группы и берут случайным образом некоторые из групп. Типическим способом пользуются тогда, когда результат наблюдения заметно колеблется в различных типических группах генеральной совокупности. Серийным способом пользуются тогда, когда результат наблюдения колеблется незначительно в различных группах, и тогда наблюдению подвергаются все объекты случайно выбранной группы (серии). Статистическая обработка выборки начинается с составления дискретного вариационного ряда (Таблица 3), где
n – объём выборки. Варианты могут быть записаны в виде точечных значений или в виде интервалов непрерывных значений. В первом случае вариационный ряд называется дискретным, во втором – интервальным. Эти ряды помогают выявить структуру изучаемого явления. Для интервального вариационного ряда в первой строке (столбце) таблицы записываются интервалы изменения непрерывного признака
При этом значение признака, находящегося на границе интервалов относят к правой границе интервала. На практике считают, что правильно составленный ряд распределения содержит от 6 до 15 частичных интервалов. Часто интервальный вариационный ряд заменяют дискретным вариационным рядом, выбирая средние значения интервала. После составления вариационного ряда необходимо построить функцию распределения выборки или эмпирическую функцию F*(x), то есть функцию найденную по данным эксперимента. Эмпирическое распределение можно изобразить в виде полигона, гистограммы или ступенчатой кривой. Ступенчатая кривая. При известном статистическом распределении частот количественного признака Х, значение
Число наблюдений
Если за F*(x)= Таким образом, для того чтобы найти, например
Эта функция служит приближённой оценкой теоретической функции распределения F(x) случайной величины Х. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F(x) определяет вероятность события Х<х, а эмпирическая функция 1) значения эмпирической функции принадлежат интервалу 2) F*(x)- неубывающая функция; 3) если На рисунке 1 изображена функция распределения Полигон частот (или многоугольник распределения) – это ломаная, отрезки которой соединяют точки ( В случае непрерывных случайных величин строится гистограмма частот или относительных частот. Это ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются частичные интервалы длиной h, а высоты равны Графическое изображение вариационных рядов в виде полигона и гистограммы позволяет получать первоначальное представление о закономерностях, имеющих место в совокупности наблюдений. На основании полученных выборочных данных необходимо сделать предположение, что изучаемая величина распределена по некоторому определённому закону. Для того чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, т.е. находят теоретически сколько раз величина Х должна была принять каждое из наблюдаемых значений, если она распределена по предполагаемому закону. Для этого находят выравнивающие (теоретические) частоты по формуле:
где n – число испытаний,
В случае непрерывного распределения весь интервал возможных значений делят на k непересекающихся интервалов и вычисляют вероятности Эмпирические и выравнивающие частоты сравнивают, и при небольшом расхождении данных, делают заключение о выбранном законе распределения.
Статистические оценки и их свойства Статистической оценкой неизвестного параметра называется функция от наблюдаемых случайных величин. Пусть Если М( Оценка Если несмещённая оценка имеет наименьшую дисперсию при одних и тех же объёмах выборки, то она называется эффективной. При большом объёме выборки наряду с требованием несмещённости и эффективности, к оценке предъявляют требование состоятельности. Оценка называется состоятельной, если вероятность сколь угодно малого отклонения оценки от оцениваемого параметра сколь угодно близка к единице:
После извлечения из генеральной совокупности выборки объёма n рассчитывают основные числовые характеристики выборки: Выборочные средние При статистической обработке материала необходимо учитывать особенности изучаемых явлений, для изучения которых требуются различные средние. Математическая статистика выводит различные средние из формул степенной средней:
Вопрос о том, какой вид средней необходимо применить, решается путём конкретного анализа изучаемой совокупности, определяется материальным содержанием изучаемого явления, а также исходя из принципа осмысленности результатов при суммировании. Средняя арифметическая: Это величина (
или где а Она исчисляется в тех случаях, когда объём усредняемого признака, образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности. Средняя гармоническая:
Эта величина применяется, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение, т.е. произведения по каждому признаку равны. Средняя квадратическая:
Средняя геометрическая:
Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел, т.е. индивидуальные значения признака – относительные величины. Она используется в расчётах среднегодовых темпов роста, а также для определения равноудалённой величины от максимального и минимального значений признака. Необходимо заметить, что разные виды средних величин при одном и том же исходном материале имеют неодинаковое значение:
Эти неравенства называются мажорантностью средних. Для характеристики структуры совокупности применяются особые показатели, которые называются структурными средними. К ним относятся мода и медиана. Выборочная мода ( Выборочная медиана ( Если Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называют вариацией признака, которую характеризуют следующие показатели: Выборочная дисперсия (
Мерой надёжности средней является выборочное среднее квадратическое отклонение (
Чем меньше Коэффициент вариации (V) - это выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней. Он служит для сравнения величин рассеяния двух вариационных рядов. Ряд, у которого коэффициент вариации больше, имеет большее рассеяние: V = Если V>33%, то имеет место большая колеблемость изучаемого признака. Для характеристики колеблемости признака используется ряд показателей. Наиболее простой - размах варьирования (R). Это разность между наибольшей и наименьшей вариантами: R = Чтобы дать обобщающую характеристику распределению отклонений, исчисляют среднее абсолютное отклонение (
Величины Выборочная средняя Для устранения смещённости выборочной дисперсии и среднего квадратического отклонения их умножают на дроби
Оценки Все оценки, рассмотренные выше – точечные. Они выражаются одним числом. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра, то есть могут возникнуть грубые ошибки. Задача интервального оценивания состоит в том, чтобы по данным выборки найти такой интервал, который с заданной вероятностью покрывает оцениваемый параметр.
Заданную вероятность Интервал ( Пусть генеральная совокупность распределена по нормальному закону, причём Вероятность заданного отклонения вычисляется по формуле:
где t =
P( Для заданного Квантилью, или левосторонней критической областью, отвечающей вероятности Доверительный интервал для оценки среднего квадратического отклонения случайной величины Х с надёжностью
где S – несмещённое значение выборочного среднего квадратичного отклонения; q – параметр, который находится по таблице (Приложение 5) на основе известного объёма выборки n и заданной надёжности оценки С помощью рядов распределения решается важнейшая задача статистики – характеристика закономерностей и изменение показателей колеблемости для варьирующих признаков. Определение формы кривой распределения является важной задачей, так как обрабатываемый материал даёт по определённому признаку характерную, типичную для него кривую. Всякое искажение формы кривой означает нарушение или изменение нормальных условий возникновения материала. Для характеристики распределений используются моменты распределения. Это средние величины отклонений определённой степени от какого-либо числа. Если это средние арифметические, то моменты называются центральными. Если отклонения отсчитываются от произвольно выбранного начала, то они называются условными. Если же это число равно 0, то моменты распределения называются начальными. Центральный эмпирический момент k -го порядка случайной величины Х вычисляется по формуле:
Наиболее точным и распространённым показателем является асимметрия (
Асимметрия положительна, если «длинная часть» кривой распределения расположена справа от математического ожидания и отрицательна, если «длинная часть» кривой расположена слева от математического ожидания. Оценка степени существенности этого показателя даётся с помощью средней квадратической ошибки, которая зависит от объёма наблюдений n и рассчитывается по формуле:
если отношение Для оценки «крутости», то есть большего или меньшего подъёма кривой распределения по сравнению с нормальной кривой, пользуются другой характеристикой - эксцессом. Эксцесс эмпирического распределения (
Если эксцесс положительный, то кривая имеет более высокую и острую вершину, чем нормальная кривая; если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и плоскую вершину, чем нормальная кривая (при равенстве математических ожиданий). Если асимметрия и эксцесс имеют небольшие значения, то предполагается близость этого распределения к нормальному.
Проверка статистической гипотезы о нормальном распределении
Наряду с задачами оценивания параметров большую группу задач математической статистики составляют задачи проверки статистических гипотез. Статистической гипотезой называется предположение относительно генеральной совокупности, проверяемое по выборочным данным. Процесс принятия решения называется проверкой статистической гипотезы. Поскольку выдвигаемая гипотеза опирается только на случайные выборочные значения, то и выводы будут носить вероятностный характер. Поэтому можно с заданной вероятностью утверждать, что гипотеза справедлива или нет.
Дата добавления: 2015-04-24; Просмотров: 1029; Нарушение авторских прав?; Мы поможем в написании вашей работы! |