КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Закон распределения двумерной случайной величины 1 страница
И РЕГРЕССИЯ СИСТЕМА ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН
Система двух случайных величин – совокупность двух случайных величин (X, Y), которые рассматриваются одновременно. Измерения обычно осуществляются попарно, а полученные значения случайных величин X и Y в определенном смысле взаимосвязаны. Закон распределения двумерной случайной величины дискретного типа представляет собой перечень значений этой величины и их вероятностей, указанных в специальной таблице. В табл.1 представлены возможные значения (x i, yj) и их совместные вероятности:
Таблица 1
Зная закон распределения дискретной двумерной случайной величины (X, Y), можно найти закон распределения каждой случайной величины X и Y:
Интегральная функция распределения двумерной случайной величины (X, Y) есть вероятность совместного выполнения неравенств X < x и Y < y, т.е. F (x, y) = P (X < x, Y < y). Двумерная случайная величина непрерывного типа может быть задана интегральной или дифференциальной функцией распределения. Если интегральная функция распределения всюду непрерывна и имеет непрерывную смешанную частную производную второго порядка, то дифференциальная функция распределения системы двух случайных величин (X, Y) определяется по формуле
Плотность распределения отдельных случайных величин, входящих в систему, выражается через плотность системы случайных величин следующим образом:
Условный закон распределения случайной величины, входящей в систему, есть закон ее распределения, полученный в предположении, что другая случайная величина приняла определенное значение. Для системы случайных величин дискретного типа условные законы распределения имеют вид
Условные математические ожидания (условные средние) дискретных случайных величин
Условные распределения показывают, что одна СВ реагирует на изменение другой изменением своего закона распределения. Такая общая зависимость называется стохастической (вероятностной) и достаточно сложна для изучения. Однако зависимость условного среднего одной СВ от значений другой является функцией, которая называется регрессией:
Уравнения таких наилучших линейных регрессий для регрессии Y на X
для регрессии X на Y
где Коэффициент корреляции
характеризует близость (или тесноту) связи между случайными величинами к линейной. Отметим, что всегда
Пусть для изучаемой случайной величины X получен ряд ее значений x 1, x 2, …, xn, который называют выборкой объема n из множества всех возможных значений X (генеральной совокупности). Эти значения xi являются случайными величинами, так как меняются от выборки к выборке. Важно, чтобы опыты для получения достоверных и правильно представляющих (репрезентативных) генеральную совокупность результатов проводились в одинаковых условиях и независимо друг от друга. Значит, случайные величины xi будут независимы и одинаково распределены. Согласно центральной предельной теореме (ЦПТ) распределение среднего значения Если число n невелико (
По теореме Бернулли (или закону больших чисел) эмпирическая вероятность приближается к теоретической вероятности при По вариационному ряду (в том числе, сгруппированному) вычисляются основные эмпирические или выборочные характеристики: выборочное среднее
Для каждой выборочной характеристики получается одно определенное значение (точка), которая является приближением соответствующей неизвестной характеристики Другой способ оценки неизвестных характеристик или параметров распределения заключается в указании интервала, куда попадает неизвестное значение с заданной вероятностью (или с заданной надежностью):
где Такие оценки называются интервальными. Например, если распределение X является нормальным с неизвестным
Если вместо значения Вероятность Отметим, что имеются и другие виды интервальных оценок для этих и других параметров распределения [1, 2]. В случае равноотстоящих друг от друга значений xi (например, для сгруппированного вариационного ряда) можно упростить вычисления выборочных характеристик, если, выбрав значение
Тогда значения условной варианты будут целыми числами, причем, большой частоте
Обратный пересчет производится по формулам
При изучении СВ возникает вопрос о возможном виде ее распределения, т.е. о соответствии (согласии) выборочных данных некоторому гипотетическому теоретическому распределению, что является одной из важных задач проверки статистических гипотез. Основное предположение называется нулевой гипотезой H 0. Возможно рассмотрение и противоположной (альтернативной) гипотезы или каких-нибудь других гипотез. В нашем случае проверка гипотезы H 0 состоит в том, что эмпирические данные получены для нормально распределенной генеральной совокупности. Следовательно, при альтернативной гипотезе эмпирические данные не согласуются с ожидаемым нормальным распределением. Проверка статистических гипотез осуществляется с помощью статистических критериев. Критерий – случайная величина, значение которой вычисляется по эмпирическим данным, т.е. по выборке. Статистический критерий определяет критическую область, при попадании в которую выборочного значения критерия нулевая гипотеза отвергается. Отвергая нулевую гипотезу (если она на самом деле верна), совершают ошибку первого рода; не отвергая нулевую гипотезу (если она на самом деле неверна), допускают ошибку второго рода. Критическая область определяется так, чтобы вероятность ошибки первого рода не превышала уровня значимости Рассмотрим достаточно простой и эффективный критерий согласия – критерий Пирсона хи-квадрат (
где mi – эмпирическая частота; pi – соответствующая вероятность для теоретического распределения; npi – теоретическая частота; Распределение критерия Отметим, что при использовании критерия Пирсона значения, частоты которых малы (mi < 5), можно объединить (обычно это крайние значения или интервалы). Пример 14. При проведении испытаний материала на разрыв получено 50 значений, характеризующих прочность на разрыв. По этим данным составлен сгруппированный вариационный ряд (масштаб 104 Па).
Оценить согласие полученных данных с нормальным распределением при уровне значимости Решение. Введем условную варианту, определив шаг h = 20 и выбрав ложный нуль C = 190, и найдем
Таблица 2
По данным табл.2 имеем n = 50 и
Найдем теоретические частоты (табл.3) для интервалов
Таблица 3
Дата добавления: 2017-02-01; Просмотров: 72; Нарушение авторских прав?; Мы поможем в написании вашей работы! |