КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Методы статистического описания результатов наблюдений 2 страница
Перейдем к рассмотрению понятия выборочной квантили. Пусть х(1),..., х(n) - вариационный ряд выборки объема п. Если пр - не целое число, то выборочной квантилью порядка р (0 < р < 1) называется k - ый член вариационного ряда, где k = [пр]+ 1. Если же пр — целое число, то соответствующая квантиль не определена (она может принимать любое значение из интервала [ x(k),х(k+1)).
Пример 34. Вычислить среднее, дисперсию, коэффициенты асимметрии и эксцесса для следующей группированной выборки:
Длина интервала группировки b = 2. Значение zi, встречающееся с наибольшей частотой, . Поэтому преобразование имеет вид , где i = 1,2,...,7. Все вычисления оформим в виде таблицы 3. Таблица 3
Контроль вычислений будет 54 + 4·(-32) + 6·134 + 4·(-278) + 1034 = 653. Находим искомые характеристики выборочного распределения: , , , , .
9.8. Двумерный случайный вектор, его статистическое описание и выборочные характеристики.
Пусть (хi, уi), i =1,2,..., n - выборка объема и из наблюдений случайного двумерного вектора (X, Y). Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой прямоугольной системой координат. Это представление выборки называется диаграммой рассеивания.
Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения (хi, уi), i =1,2,..., n, с вероятностями, равными 1/ n. Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.
Пример 35. Найти выборочные средние, дисперсии и коэффициент корреляции для выборки, приведенной в таблицей. Построить диаграмму рассеивания. Решение. Вычисление указанных выборочных характеристик удобно выполнять в следующей последовательности. Сначала вычисляют суммы , , , , , .Для контроля правильности вычислений используется тождество . Таблица 4
Объем выборки п = 42. Выборочные средние отсюда находятся по формулам , Затем вычисляются суммы квадратов отклонений от среднего и произведений отклонений от средних: , , Отсюда , , . Предварительно вычислим , , , , . Тогда найдем , . Далее находим , , . Окончательно, получаем , , . Диаграмма рассеивания приведена на рис. 11.
Рис. 11.
Выборочная линейная регрессия Y на X по выборке (хi, уi), i =1,2,..., n, определяется уравнением . Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам: , . Аналогично определяется выборочная линейная регрессия X на Y: коэффициенты и которой находятся по формулам
, . Для контроля правильности расчетов используют соотношение . Прямые , пересекаются в точке с координатами .
Пример 36. Вычислить выборочные коэффициенты линейной регрессии X на Y и Y на X по выборке примера 35. Нанести прямые регрессии на диаграмму рассеивания. Решение. Воспользуемся результатами вычислений в примере 35. По формулам находим , . Таким образом, прямая регрессии Y на X имеет уравнение y =-5,705+1,103 x. Аналогично находим , . Отсюда прямая регрессии X на Y имеет уравнение х = 7,637 + 0,599 у. Проверка показывает , что полученный результат совпадает со значением r, вычисленным в примере 35. Прямые регрессии нанесены на диаграмму рассеивания на рис.11.
9.9. Корреляционная таблица . Двумерную выборку большого объема представляют в виде корреляционной таблицы. С этой целью группируют реализации величин X и Y по интервалам длины bх и by, а в клетки таблицы записывают число пар исходной выборки (т. е. частоты) для каждой комбинации интервалов. Эту процедуру можно также выполнить непосредственно по диаграмме рассеивания, нанося на нее сетку горизонтальных и вертикальных прямых, взятых с постоянными шагами bх и by. Наблюдения, которые попали на верхнюю и правую границы рассматриваемого прямоугольника, относятся соответственно к соседним верхнему и правому прямоугольникам. В дальнейших вычислениях используются середины интервалов и соответствующие частоты. Обозначим середины интервалов через , i =1,2,..., k и , j =1,2,..., l, а соответствующие частоты через nij; очевидно, . Полагаем , . Для упрощения вычислений вместо середин интервалов и введем числа , i =1,2,..., k, , j =1,2,..., l, где и - середины наиболее часто встречающихся интервалов. Определение выборочных числовых характеристик распределения по корреляционной таблице выполняется в следующей последовательности. Сначала вычисляют суммы , , , , . Затем определяют следующие суммы: , , . Выборочные средние, дисперсии и коэффициент корреляции находят по формулам , , , , . Коэффициенты и линейной регрессии Y на X и X на Y вычисляют по формулам , . Коэффициенты и находят по соответствующим формулам.
Пример 37. Используя группировку выборки, заданной таблицей 4 в примере 35, вычислить выборочные средние, дисперсии, коэффициент корреляции, а также выборочные коэффициенты линейной регрессии Х на Y и Y на Х.
Решение. Выберем bx= 1, by= 2. Прямоугольная сетка, соответствующая этим значениям, нанесена на диаграмму рассеивания (рис. 11). Непосредственно по диаграмме строим корреляционную таблицу (таблица 5). Находим , и вычисляем значения ui и vj по формулам , i =1,2,...,9, , j =1,2,...,7. Вычисляем следующие суммы: , , , , . По формулам находим , , . Далее получаем , , , , . Находим выборочные коэффициенты регрессии: , , , . Окончательно получим, что уравнение линейной регрессии Y на X имеет вид у = -5,74 + 1,12 x, а уравнение линейной регрессии X на Y имеет вид x = 7,72 + 0,58 y. Расхождение полученных результатов с результатами выше рассмотренных примеров обусловлено группировкой. Таблица 5. Корреляционная таблица для диаграммы рассеивания к примеру 37.
Дата добавления: 2014-11-20; Просмотров: 601; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |