КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Элементы теории корреляции
На практике часто приходится сталкиваться с зависимостью между различными признаками, например, между длиной тела рыбы и ее весом, между толщиной снегового покрова и объемом стока последующего половодья. Обычно эта зависимость более общего типа, чем функциональная - корреляционная или стохастическая вероятностная зависимость. При корреляционной зависимости каждому значению одной случайной величины соответствует ряд распределения другой случайной величины. Корреляционный анализ наряду с выборочным методом представляет собой важнейшее прикладное направление математической статистики. Предметом его исследования является связь (зависимость) между различными варьирующими признаками (переменными величинами), при которой каждому значению одной переменной соответствует не определенное значение другой (как это имеет место при функциональной зависимости), а ряд распределения с определенной групповой средней. При изучении этой важной темы следует уяснить сущность статистической и ее частного случая - корреляционной зависимости. Конечная цель корреляционного анализа - получение уравнений прямых регрессии, характеризующих форму зависимости, и вычисление коэффициента корреляции, определяющего тесноту (силу) связи, если она линейная. Расчет производится в два основных этапа. На первом обрабатывают табличные данные для нахождения величин , ,σх, σу и μ. При этом используется упрощенная схема вычисления (т.е. переход от хi и уi к условным переменным), а далее применяются расчетные формулы. Графическое изображение прямых регрессии (обе должны быть построены на одном чертеже) служит для контроля правильности расчетов: они должны образовывать с осью ОХ либо только острые, либо только тупые углы в зависимости от знака μ, (или r), опытные точки с координатами ( , ) и (хy,у) должны располагаться по обе стороны соответствующих прямых регрессии; прямые регрессии должны пересекаться в центре распределения ( ; ). Чертеж следует выполнять четко и аккуратно, удачно выбирая масштабы по каждой оси (они могут быть разными) и начала отсчетов. Все расчеты следует вести с разумной степенью точности (как правило, сохраняя два знака после запятой в окончательных данных). Для этого в промежуточных вычислениях достаточно сохранить три знака после запятой (правило «лишней» цифры). Прежде чем проводить вычисления, нужно записать соответствующие расчетные формулы. Особенно внимательно отнеситесь к расчетам в таблицах, так как допущенная ошибка приведет к неустранимым погрешностям в окончательных результатах. В конце решения надо кратко сформулировать окончательные результаты и дать характеристику исследуемой корреляционной зависимости (по величине, знаку коэффициента корреляции и оценке его достоверности).
Пример 61. Результаты измерения диаметров (х) и высот (у) 250 сосен записаны в таблицу.
Составить уравнения регрессии и найти коэффициент корреляции. Уравнения регрессии имеют вид: , , где и - средние значения величин х и у; σх и σу - средние квадратические отклонения величин х и у; rв - выборочный коэффициент корреляции, вычисляемой по формуле: . Для определения всех этих величин пользуемся методом произведений. Дополним данную таблицу несколькими строками и столбцами. На основании метода произведений запишем, что , , где Сx и Сy - значения величин х и у, имеющих большую частоту; u, v - средние значения условных вариант, вычисление по фор мулам: ; ; ; , где hx и hy -разность между соседними значениями X и Y. Вычислим и : , . Пользуясь методом произведений, находим средние квадратические отклонения величин х и у: , . Вычислим σu и σv по формулам средних квадратических отклонений: , , . Находим: , . При переходе к условным вариантам и коэффициент корреляции имеет вид: . Для вычисления величины применяется метод «четырех полей». Строка и столбец, на пересечении которых находится наибольшая частота (49), делят таблицу на четыре поля. В верхнем углу каждой заполненной клетки, расположенной в одном из четырех полей, записываем соответствующие произведения uv, а затем подсчитываем сумму произведений . Определяем, сколько раз nuv встречаются произведения uv. Получаем: Определим коэффициент корреляции . Напишем уравнения регрессий или , или . Имея уравнение регрессии, можно вычислить средние значения одной величины при любом значении другой.
Дата добавления: 2014-11-20; Просмотров: 869; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |