Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляционный и регрессионный анализ




Пример выполнения задания № 1

 

Задание. По данным наблюдений и (табл. 2) определить вид эмпирической зависимости, для чего:

- найти методом наименьших квадратов коэффициенты эмпирической функции (линейная и нелинейная зависимость);

- определить погрешность вычислений.

Таблица 2

x   0,5 1,0 1,5 2,0
y 7,0 4,8 2,8 1,4  

Решение. 1. Изобразим точки на графике (диаграмма разброса) (рис.2).

Рис. 2. Диаграмма разброса

2. В качестве эмпирической формулы примем линейную зависимость вида: . Заполним таблицу 3, в которой добавлены столбцы ,

, , которые понадобятся в дальнейших расчетах.

Таблица 3

N
1 2 3 4 5 6 7 8
          7,0    
  0,5 0,25 0,125 0,0625 4,8 2,4 1,2
  1,0 1,0     2,8 2,8 2,8
  1,5 2,25 3,375 5,0625 1,4 2,1 3,15
  2,0            
Сумма 5,0 7,5 12,5 22,125   7,3 7,15

 

Используя табличные данные (столбцы 2, 3, 6, 7) и N=5, составим систему нормальных уравнений (2):

Подставим значения из таблицы 3:

Найдем и по формуле (3):

;

.

Следовательно, уравнение линии: .

Оценим точность выполненных построений, подставив в полученную формулу значения , вычислив значения и отклонения . Результаты вычислений заносим в таблицу 4.

Суммируя данные последнего столбца, получаем:

Таблица 4

N
1 2 3 4 5 6
    7,0 6,68 0,32 0,1024
  0,5 4,8 4,94 -0,14 0,0196
  1,0 2,8 3,20 -0,40 0,1600
  1,5 1,4 1,46 -0,06 0,036
  2,0   -0,28 0,28 0,0784
Сумма         0,364

 

Средняя квадратическая ошибка на единицу веса по формуле (6):

где =5 - число вычисляемых (табличных) значений; =2 – число параметров ( и ).

Полученные величины показывают, что формула подобрана неудовлетворительно, так как исходные данные (см. табл. 2) имеют точность до 0,1, а средняя квадратическая ошибка на единицу веса значительно больше 0,1. Следовательно, подобранное уравнение линейной зависимости не удовлетворяет предъявляемым требованиям точности.

3. Найдем уравнение нелинейной зависимости, для этого повторим все операции, используя выражение: .Составим систему нормальных уравнений (5).

 

Подставим числовые значения из таблицы 3:

Решая данную систему, например, методом Крамера, найдем:

; ;

Тогда искомая зависимость: .

Для определения средней квадратической ошибки составим таблицу 5.

Таблица 5

N
1 2 3 4 5 6
    7,0 7,0    
  0,5 4,8 4,79 0,01 0,0001
  1,0 2,8 2,89 -0,09 0,0081
  1,5 1,4 1,3 0,1 0,0100
  2,0   0,04 -0,04 0,0016
Сумма         0,0198

Суммируя элементы последнего столбца, получим: .

Средняя квадратическая ошибка на единицу веса (6):

.

где =5 - число вычисляемых (табличных) значений; =3 – число параметров (, , ).

Исходные данные имеют точность до 0,1, а средняя квадратическая ошибка на единицу веса меньше 0,1. Следовательно, полученная эмпирическая формула соответствует экспериментальным

данным.

Функциональная зависимость между двумя переменными величинами характеризуется тем, что каждому значению одной из них соответствует определенное значение другой, однако часто встречаются переменные величины, когда каждому значению одной из них соответствует некоторое распределение другой. В этом случае говорят, что задана корреляционная зависимость между двумя случайными величинами. Эта зависимость обычно задается в виде корреляционной таблицы, в которой даны признаки величин и их частоты.

Основными задачами корреляционного анализа являются:

1. Определение формы связи, то есть нахождение по корреляционной таблице функции зависимости (линейной, нелинейной и множественной).

2. Установление тесноты связи, то есть оценка степени рассеяния значений одной переменной около линии регрессии для разных значений другой переменной.

 




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 368; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.02 сек.