![]() КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 4 : Элементы теории корреляции
..... [ [ [ [ [
Здесь Теоретические частоты Величина Из этого следует критерий для проверки гипотезы о распределении изучаемой случайной величины (критерий Пирсона). Рассмотрим его при-менение для проверки гипотезы о нормальном распределении. Пусть эмпирическое распределение задано в виде вариационного ряда равноотстоящих вариант с шагом h
Необходимо: 1. Вычислить выборочное среднее и исправленное выборочное среднее квадратическое отклонение 2. Определить теоретические частоты, считая закон распределения нормальным, т.е.
где
3. По формуле (1) вычислить величину 4. Определить число степеней свободы для нормального распределения 5. По таблице критических точек распределения Уровень значимости Замечание 1. Рассмотренный критерий на практике даёт хорошие результаты, если Пример 1. Проверить, согласуются ли данные таблицы с предполо-жением, что рост мужчины является нормально распределённой случайной величиной, приняв уровень значимости
Из таблицы следует, что Таким образом,
4.1. Статистические зависимости
Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от другой случайной величины Х. Две случайные величины могут быть связаны определённой зависимостью, которую принято называть статистической, или быть независимыми. Определение 1. Статистической называется зависимость, при которой изменение одной случайной величины Х влияет на распределение другой случайной величины Y. Если при этом изменяется еще и среднее значение случайной величины Y, то такая зависимость называется корреляционной. Например, пусть Х - сумма затрат на подготовку лавы, а Y - уровень добычи угля. При одинаковых затратах на подготовку лав добыча угля будет отличаться, т.е. СВ Y не является функцией от Х. Это можно объяснить влиянием случайных факторов (глубиной залегания пласта, его мощностью, сортностью угля и т.п.). Тем не менее, средняя добыча угля является функцией от суммы затрат, т.е. случайные величины Y и Х связаны корреляционной зависимостью. 4.2. Линейная регрессия
Определение 2. Выборочным уравнением линейной регрессии случайной величины Y на Х называется уравнение вида
Уравнение (3) часто называют просто уравнением линейной регрессии, а угловой коэффициент Для отыскания выборочного уравнения регрессии воспользуемся методом наименьших квадратов, т.е. мы должны минимизировать функцию суммы квадратов отклонений Как было показано ранее, в этом случае коэффициенты уравнения (3) определяются по формулам
где Пример 2. Найти выборочное уравнение линейной регрессии СВ Y на Х по данным 10 наблюдений:
Составим расчетную таблицу:
По формулам (4) получим Таким образом, линейная регрессия имеет вид Проверим, насколько хорошо полученные результаты согласуются с наблюдаемыми данными. Найдем отклонения
Как видим из таблицы, не все отклонения достаточно малы. Это объясняется недостаточным количеством наблюдаемых данных.
4.3. Корреляционная таблица
При большом числе наблюдений одно и то же значение СВ Х может встретиться Поясним ее строение на простом примере. Имеем таблицу:
В первой строке указаны наблюдаемые значения (1, 2, 3, 4, 5) случайной величины Х, а в первом столбце – наблюдаемые значения (-1, 0, 1, 2) случайной величины Y. На пересечении строк и столбцов находятся частоты В последнем столбце записаны суммы частот строк. Например, сумма частот второй строки равна В последней строке записаны суммы частот столбцов. Например, сумма частот четвертого столбца равна Общее число наблюдений
4.4. Выборочный коэффициент корреляции
Ранее мы полагали, что значения Х и соответствующие им значения Y наблюдались по одному разу. На практике, безусловно, одна пара случайных величин (х, у) может наблюдаться любое число раз. Поэтому формула для коэффициента регрессии (4) примет вид
где в сумме Умножим обе части равенства (5) на дробь Тогда уравнение линейной регрессии Y на Х будет иметь вид Замечание 2. Выборочный коэффициент корреляции является безраз-мерной оценкой коэффициента регрессии Таким образом, основная задача корреляционного анализа состоит в оценке степени линейной связи между случайными величинами Х и Y, кото-рая устанавливается при помощи выборочного коэффициента корреляции
Дата добавления: 2014-11-16; Просмотров: 413; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |