КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Выборочные среднее и дисперсия
Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объема n. Выборочным средним Если значения признака Выборочное среднее, найденное по данным одной выборки, равно определенному числу. При извлечении других выборок того же объема выборочное среднее будет меняться от выборки к выборке. То есть выборочное среднее можно рассматривать как случайную величину и говорить о его распределениях (теоретическом и эмпирическом) и о числовых характеристиках этого распределения (например, о математическом ожидании и дисперсии). Для охарактеризования рассеяния наблюдаемых значений количественного признака выборки вокруг среднего значения Если значения признака Аналогично выборочным среднему и дисперсии определяются генеральные среднее и дисперсия, характеризующие генеральную совокупность в целом. Для расчета этих характеристик достаточно в вышеприведенных соотношениях заменить объем выборки n на объем генеральной совокупности N. Фундаментальное значение для практики имеет нахождение среднего и дисперсии признака генеральной совокупности по соответствующим известным выборочным параметрам. Можно показать, что выборочное среднее является несмещенной состоятельной оценкой генерального среднего. В то же время, несмещенной состоятельной оценкой генеральной дисперсии оказывается не выборочная дисперсия Таким образом, в качестве оценок генерального среднего и дисперсии в математической статистике принимают выборочнее среднее и исправленную выборочную дисперсию.
Надежность и доверительный интервал. До сих пор мы рассматривали точечные оценки, т.е. такие оценки, которые определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. В связи с этим при небольшом объеме выборки пользуются интервальными оценками. Интервальной называют оценку, определяющуюся двумя числами – концами интервала. Пусть найденная по данным выборки статистическая характеристика Статистические методы не позволяют утверждать, что оценка Надежностью (доверительной вероятностью) оценки Пусть вероятность того, что Заменим неравенство
Это соотношение следует понимать так: вероятность того, что интервал Таким образом, доверительным называют интервал
Величину 1 - g = a называют уровнем значимости или вероятностью ошибки. Для построения интервальной оценки параметра необходимо знать закон его распределения как случайной величины
Лекция 14. Доверительные интервалы для математического ожидания и дисперсии
Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения известно. Требуется оценить неизвестное математическое ожидание Будем рассматривать выборочное среднее Потребуем, чтобы выполнялось соотношение где Заменим X на
где Так как вероятность P задана и равна
Таким образом, с надежностью Число Отметим два момента: 1) при возрастании объема выборки n число Если требуется оценить математическое ожидание с наперед заданной точностью
следующей из равенства
2. Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения неизвестно. Требуется оценить неизвестное математическое ожидание с помощью доверительных интервалов. Оказывается, что по данным выборки можно построить случайную величину которая имеет распределение Стьюдента с
Несколько слов о распределении Стьюдента. Пусть имеет распределение Стьюдента (В. Госсет) с Как видно, распределение Стьюдента определяется параметром n – объемом выборки (или, что то же самое – числом степеней свободы определяется следующим образом: Заменив неравенство в круглых скобках двойным неравенством, получим выражение для искомого доверительного интервала Итак, с помощью распределения Стьюдента найден доверительный интервал Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n = 16 найдены генеральное среднее Решение. Найдем
То есть с надежностью 0,95 неизвестный параметр a заключен в доверительном интервале Можно показать, что при возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому практически при n > 30 можно вместо него пользоваться нормальным распределением. При малых n это приводит к значительным ошибкам. 3. Доверительный интервал для оценки среднего квадратического отклонения s нормального распределения Пусть количественный признак X генеральной совокупности распределен нормально и требуется оценить неизвестное генеральное среднее квадратическое отклонение s по исправленному выборочному среднему квадратическому отклонению s. Найдем доверительные интервалы, покрывающие параметр s с заданной надежностью Потребуем, чтобы выполнялось соотношение
Преобразуем двойное неравенство и необходимо найти q. С этой целью введем в рассмотрение случайную величину Оказывается, величина Несколько слов о распределении хи-квадрат. Если имеет распределение хи-квадрат с Плотность распределения c имеет вид
Это распределение не зависит от оцениваемого параметра s, а зависит только от объема выборки n. Преобразуем неравенство (A) так, чтобы оно приняло вид Предполагая, что q < 1, перепишем (A) в виде
далее, умножим все члены неравенства на
Вероятность того, что это неравенство, а также равносильное ему неравенство (A) будет справедливо, равна
Из этого уравнения можно по заданным Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n = 25 найдено исправленное среднее квадратическое отклонение s = 0.8. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение s с надежностью 0,95. Решение. По заданным
Мы предполагали, что q < 1. Если это не так, то мы придем к соотношениям
и значение q >1 может быть найдено из уравнения
Лекция 14. Доверительные интервалы для математического ожидания и дисперсии
Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения известно. Требуется оценить неизвестное математическое ожидание Будем рассматривать выборочное среднее Потребуем, чтобы выполнялось соотношение где Заменим X на
где Так как вероятность P задана и равна
Таким образом, с надежностью Число Отметим два момента: 1) при возрастании объема выборки n число Если требуется оценить математическое ожидание с наперед заданной точностью
следующей из равенства
4. Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение s этого распределения неизвестно. Требуется оценить неизвестное математическое ожидание с помощью доверительных интервалов. Оказывается, что по данным выборки можно построить случайную величину которая имеет распределение Стьюдента с
Несколько слов о распределении Стьюдента. Пусть имеет распределение Стьюдента (В. Госсет) с Как видно, распределение Стьюдента определяется параметром n – объемом выборки (или, что то же самое – числом степеней свободы определяется следующим образом: Заменив неравенство в круглых скобках двойным неравенством, получим выражение для искомого доверительного интервала Итак, с помощью распределения Стьюдента найден доверительный интервал Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n = 16 найдены генеральное среднее Решение. Найдем
То есть с надежностью 0,95 неизвестный параметр a заключен в доверительном интервале Можно показать, что при возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому практически при n > 30 можно вместо него пользоваться нормальным распределением. При малых n это приводит к значительным ошибкам. 3. Доверительный интервал для оценки среднего квадратического отклонения s нормального распределения Пусть количественный признак X генеральной совокупности распределен нормально и требуется оценить неизвестное генеральное среднее квадратическое отклонение s по исправленному выборочному среднему квадратическому отклонению s. Найдем доверительные интервалы, покрывающие параметр s с заданной надежностью Потребуем, чтобы выполнялось соотношение
Преобразуем двойное неравенство и необходимо найти q. С этой целью введем в рассмотрение случайную величину Оказывается, величина Несколько слов о распределении хи-квадрат. Если имеет распределение хи-квадрат с Плотность распределения c имеет вид
Это распределение не зависит от оцениваемого параметра s, а зависит только от объема выборки n. Преобразуем неравенство (A) так, чтобы оно приняло вид Предполагая, что q < 1, перепишем (A) в виде
далее, умножим все члены неравенства на
Вероятность того, что это неравенство, а также равносильное ему неравенство (A) будет справедливо, равна
Из этого уравнения можно по заданным Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n = 25 найдено исправленное среднее квадратическое отклонение s = 0.8. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение s с надежностью 0,95. Решение. По заданным
Мы предполагали, что q < 1. Если это не так, то мы придем к соотношениям
и значение q >1 может быть найдено из уравнения
Лекция 15. Проверка статистических гипотез. Нулевая и альтернативная гипотезы, статистический критерий. Ошибки первого и второго рода. Этапы проверки статистической гипотезы. Критерий согласия Пирсона о виде распределения. На прошлой лекции мы рассматривали задачу построения доверительных интервалов для неизвестных параметров генеральной совокупности. Сегодня мы продолжим изучение основных задач математической статистики и перейдем к вопросу проверки статистических гипотез. Проверка статистических гипотез представляет собой важнейший этап процесса принятия решения в управленческой деятельности, позволяя проводить подготовительный этап предстоящих действий с учетом реальных характеристик процесса производства, контроля качества продукции, коммерческой деятельности, и т.п. Как известно, закон распределения определяет количественные характеристики генеральной совокупности. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (например, А), то выдвигают гипотезу: генеральная совокупность распределена по закону А. В этой гипотезе речь идет о виде предполагаемого распределения. Часто закон распределения известен, но неизвестны его параметры. Если есть основания предположить, что неизвестный параметр Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и т. д. Приведем несколько задач, которые могут быть решены с помощью проверки статистических гипотез. 1. Используется два метода измерения одной и той же величины. Первый метод дает оценки 2. Контроль точности работы некоторой производственной системы. Получаемые характеристики выпускаемой продукции характеризуются некоторым разбросом (дисперсией). Обычно величина этого разброса не должна превышать некоторого заранее заданного уровня. Требуется определить, обеспечивает ли система (например, линия сборки или отдельный станок) заданную точность. Итак, статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Примеры статистических гипотез: генеральная совокупность распределена по закону Пуассона; дисперсии двух нормальных распределений равны между собой. Наряду с выдвинутой гипотезой всегда рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то принимается противоречащая гипотеза. Нулевой (основной) называют выдвинутую гипотезу Альтернативной (конкурирующей) называют гипотезу Простой называют гипотезу, содержащую только одно предположение. Например, если Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Так как проверку производят статистическими методами, то ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Следует отметить, что последствия ошибок могут оказаться различными. Если отвергнуто правильное решение "продолжать строительство жилого дома", то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение "продолжать строительство" несмотря на опасность обвала дома, то эта ошибка второго рода может привести к многочисленным жертвам. Иногда, наоборот, ошибка первого рода влечет более тяжелые последствия. Естественно, правильное решение может быть принято также в двух случаях, когда принимается правильная гипотеза или отвергается неверная гипотеза. Вероятность совершения ошибки первого рода называют уровнем значимости и обозначают
Дата добавления: 2014-01-06; Просмотров: 4355; Нарушение авторских прав?; Мы поможем в написании вашей работы! |