Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корреляционно-регрессионный анализ экспериментальных данных




Цель занятия:Закрепить знания и сформировать умение проводить корреляционно-регрессионный анализ экспериментальных данных.

 

Порядок выполнения работы

 

1. Ознакомиться корреляционным и регрессионным анализом экспериментальных данных.

2. Ознакомиться с порядком выполнения корреляционно-регрессионного анализа экспериментальных данных.

3. Определить линейную аналитическую зависимость уо = f(x), описывающую экспериментальные данные, полученные в результате наблюдения (для выбора исходных данных использовать таблицу П1 и П2).

4. Устно подготовиться к ответам на контрольные вопросы.

 

Отчет должен содержать

 

1. Понятия корреляционного и регрессионного анализа экспериментальные данные.

2. Расчет линейной аналитической зависимости уо = f(x), описывающей экспериментальные данные.

3. Выводы о достоверности и адекватности уравнения регрессии.

1. корреляционный анализ экспериментальных данных

 

Корреляционный анализ – статистический метод оценки формы, знака и тесноты связи исследуемых признаков или факторов. Совместную изменчивость разных признаков называют «корреляция» (co-relation – связь, соотношение).

В задачу статистического анализа входят выявление величины корреляционной связи и установление ее типа.

Один из основных коэффициентов, измеряющих связь между варьирующими признаками х и у, является коэффициент корреляции r, который находятся в пределах от 0 до ± 1.

Коэффициент корреляции определяется по следующему выражению:

 

х (1)

где – значение единичного результата и средняя арифметическая одного признака; – значение единичного результата и средняя арифметическая другого зависимого признака.

 

По значению коэффициента корреляции определяют характер корреляционной связи (табл. 1).

Таблица 1

 

Сила и характер связи между параметрами

Сила связи Характер связи
прямая «+» обратная «–»
Полная   -1
Сильная от 0,7 до 1 от -0,7 до -1
Средняя от 0,3 до 0,7 от -0,3 до -0,7
Слабая от 0,3 до 0 от -0,3 до 0
Связь отсутствует    

2. регрессионный анализ экспериментальных данных.

Регрессионный анализ – статистический метод исследования зависимости между зависимой переменной у и одной или несколькими независимыми переменными х1, х2,..., хn.

При полном факторном эксперименте влияние факторов на результат эксперимента раскрывается с помощью уравнения регрессии.

Регрессия - величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х.

Уравнение регрессии выражает среднюю величину одного признака как функцию другого.

Построение уравнение регрессии осуществляется в два этапа:

– определение вида аналитической зависимости y=f(x);

– оценка параметров выбранной модели.

Для определении вида аналитической зависимости применяются три основных метода:

– графический (на основе анализа поля корреляций);

– аналитический, т. е. исходя из теории изучаемой взаимосвязи;

– экспериментальный, т.е. путем сравнения величины остаточной дисперсии или средней ошибки аппроксимации, рассчитанных для различных моделей регрессии (метод перебора).

Наиболее часто при проведении исследований встречаются линейные, параболические, гиперболические, степенные, экспоненциальные зависимости (рисунок 1).

Рис. 1. Виды аналитических зависимостей

 

Для оценки параметров выбранной модели используют метод наименьших квадратов (МНК). Он позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака уi от теоретических значений у0 при тех же значениях фактора х минимальна, т. е.:

 

(2)

 

В случае линейной регрессии (у0 = a ± bх) параметры а и b находятся из следующей системы нормальных уравнений метода наименьших квадратов:

(3)

 

где n – количество наблюдений.

 

Коэффициенты а и b при факторной переменной х имеют следующую интерпретацию:

– коэффициент а показывает значение средней величины у при х=0;

– коэффициент b показывает, насколько изменится в среднем величина у при изменении фактора х на 1 единицу измерения.

Точность аппроксимации уравнения регрессии оценивают с помощью средней ошибки аппроксимации – среднее относительной отклонение расчетных значений (у0) от фактических (yi). Ее определяют по следующему выражению:

 

(4)

 

В случае линейной регрессии (у0 = a ± bх) параметры а и b находятся из следующей системы нормальных уравнений метода наименьших квадратов:

 

(3)

 

Коэффициенты а и b при факторной переменной х имеют следующую интерпретацию:

– коэффициент а показывает значение средней величины у при х=0;

– коэффициент b показывает, насколько изменится в среднем величина у при изменении фактора х на 1 единицу измерения.

Точность аппроксимации уравнения регрессии оценивают с помощью средней ошибки аппроксимации - среднее относительной отклонение расчетных значений (у0) от фактических (yi). Ее определяют по следующему выражению:

 

(4)

 

Построенное уравнение регрессии считается удовлетворительным, если средняя ошибка аппроксимации не превышает 10 %.

Для оценки значимости уравнения регрессии в целом используется F-критерий Фишера.

F-критерий Фишера заключается в проверке гипотезы Но о статистической незначимости уравнения регрессии. Для этого выполняется сравнение фактического – Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.

Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы

 

(5)

 

где n – число единиц совокупности (количество наблюдений); m – число параметров при переменных. Для линейной регрессии m = 1.

 

Fфакт – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы

 

(6)

 

(7)

и уровне значимости α.

 

Уровень значимости α. – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина α. принимается равной 0,05 или 0,01.

Если Fтабл < Fфакт, то Но-гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fфакт > Fтабл, то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

 

 

3. порядок проведения корреляционно-регрессионный анализ экспериментальных данных

 

По имеющимся данным п наблюдений за совместным изменением двух параметров х и уi, уi), i=1, 2,..., п) необходимо определить линейную аналитическую зависимость , наилучшим образом описывающие данные наблюдений.

3.1. Порядок выполнения корреляционно-регрессионного анализа

3.1.1. По двум последним цифрам номера зачетной книжки выписать из приложения данного методического указания исходные данные для расчета (таблицы П1 и П2).

3.1.2. Определить средние значения х и у.

 

3.1.3. По формуле (1) выполнить пошаговый расчет коэффициента корреляции (таблица 2). Сделать вывод о силе и характере связи переменных.

Таблица 2

 

Пошаговый расчет коэффициента корреляции

 

№ п/п
           
           
...          
           
Сумма          

 

3.1.4. Используя формулу (3), определить значения коэффициентов для линейной аналитической зависимости. Расчеты выполнить в виде таблицы 3.

 

Таблица 3

 

Подготовка исходных данных для расчета коэффициентов уравнения регрессии

 

№ п/п Значения х Значения у х2 у·х
         
         
...        
         
Сумма        

 

3.1.5. Построить корреляционное поле экспериментальных данных и теоретическую линию, полученную по уравнению регрессии

 

3.1.6. По формуле (4) определить среднюю ошибку аппроксимации. Расчет произвести пошагово с использованием таблицы 4. Сделать вывод о точности аппроксимации уравнения регрессии.

Таблица 4

 

Расчет средней ошибки аппроксимации

 

№ п/п х у
           
           
...          
           
Сумма          

3.1.7. Определить по формуле (5) фактическое значение F-критерия Фишера.

 

3.1.8. Найти по выражениям (6), (7) число степеней свободы и определить из таблицы П3 приложения табличное значение F табл. Сравнить фактическое значение F-критерия Фишера с табличным и сделать вывод об адекватности уравнения регрессии.

 

3.2. Пример выполнения корреляционно-регрессионного анализа

 

3.2.1. Из таблиц П1, П2 выписываем исходные данные для расчета и заносим их в таблицу 5.

 

Таблица 5

Исходные данные

 

х                    
у                    

 

3.2.2. Определяем средние значения х и у.

 

 

 

3.2.3. Пошагово находим коэффициент корреляции. Для удобства расчет составляющих формулы (1) выполним с использованием таблицы 6.

 

Таблица 6

Пошаговый расчет коэффициента корреляции

 

№ п/п
  -30,3 43,3 -1311,99 918,09 1874,89
  -19,3 33,3 -642,69 372,49 1108,89
  -13,3 20,3 -269,99 176,89 412,09
  -11,3 17,3 -195,49 127,69 299,29
  -6,3 6,3 -39,69 39,69 39,69
  7,7 -6,7 -51,59 59,29 44,89
  11,7 -13,7 -160,29 136,89 187,69
  15,7 -20,7 -324,99 246,49 428,49
  20,7 -34,7 -718,29 428,49 1204,09
  24,7 -44,7 -1104,09 610,09 1998,09
Сумма - - -4819,1 3116,1 7598,1

Рассчитываем коэффициент корреляции

 

 

Полученное значение коэффициента корреляции показывает, что сила связи параметров х и у сильная, а характер связи – обратный (табл. 1).

 

3.2.4. Используя формулу (3), определяем значения коэффициентов для линейной аналитической зависимости. Для удобства выполнения расчетов подготовим данные (таблица 7).

Таблица 7

 

Подготовка исходных данных для расчета коэффициентов уравнения регрессии

 

№ п/п Значения х Значения у
         
  128-      
         
         
         
         
         
         
         
         
Сумма        

 

Подставляем полученные исходные данные в систему уравнений.

 

 

 

Выражаем из первого уравнения системы коэффициент a

 

Полученное выражение подставляем во второе уравнение системы и находим значение коэффициента b.

 

 

 

Определяем величину коэффициента а.

 

 

Подставляем полученные значения коэффициентов в уравнение регрессии.

 

 

3.2.5. Строим корреляционное поле экспериментальных данных и теоретическую линию, полученную по уравнению регрессии (рис. 2).

 

Рис. 2. Зависимость параметра у от параметра х

 

3.2.6. Определяем среднюю ошибку аппроксимации. Расчет произведем пошагово с использованием таблицы 8.

Таблица 8

Расчет средней ошибки аппроксимации

 

№ п/п х у
      368,7 -3,65 0,0100
      351,6 3,4 0,0096
      342,3 -0,3 0,0009
      339,2 -0,2 0,0006
      331,5 -3,45 0,0105
      309,8 5,25 0,0167
      303,6 4,45 0,0144
      297,4 3,65 0,0121
      289,6 -2,6 0,0091
      283,4 -6,4 0,0231
Сумма - - - - 0,1070

 

Рассчитываем среднюю ошибку аппроксимации

 

Точность аппроксимации уравнения регрессии удовлетворительна, так как ее средняя ошибка не превышает 10 %.

 

3.2.7. Определяем фактическое значение F -критерия Фишера

 

 

3.2.8. Определяем число степеней свободы

 

8

 

По таблице П3 приложения определяем максимально возможное значение критерия

 

 

Уравнение регрессии достоверно описывает экспериментальные данные и является адекватным в заданных пределах варьирования исследуемых факторов, так как фактическое значение F-критерия Фишера значительно превышает табличное

Контрольные вопросы

 

1. Что такое корреляционный анализ?

2. Что означает знак и величина коэффициента корреляции?

3. Дайте понятие регрессионного анализа и уравнения регрессии.

4. Какие существуют методы определения вида аналитической зависимости и в чем их сущность?

5. Для чего применяют метод наименьших квадратов?

6. Что показывает средняя ошибка аппроксимации?

7. В чем заключается сущность оценки адекватности уравнения регрессии по F-критерию Фишера?

 

 

Библиографический список

 

1. Боровиков В.П., Боровиков И.П. STATISTICA – Статистический анализ и обработка данных в среде Windows. – М.: Информационно-издательский дом "Филинъ", 1998.

2. Браверман Э.М., Мучник И.Б. Структурные методы обработки эмпирических данных. – М.: Наука, 1983.

3. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для студентов вузов. - М.: Высш.шк.. - 2000. - 479с.

4. Львовский Е.Н. Статистические методы построения эмпирических формул: Учебное пособие для вузов. - М.: Высш. школа,1988 -239 с.

5. Практическое использование Microsoft Excel для обобщения статистических данных и их презентации: Хорст-Дитер Радке – Москва, НТ Пресс, 2008 г.- 272 с.

6. Прикладной регрессионный анализ: Норман Р. Дрейпер, Гарри Смит – Санкт-Петербург, Вильямс, Диалектика, 2007 г.- 912 с.

7. Теория вероятностей и математическая статистика: Ю. В. Кожевников – Москва, Машиностроение, 2002 г.- 416 с.

 

 


ПРИЛОЖЕНИЯ

 

Вариант задания определяется предпоследней цифрой зачетной книжки студента. Необходимыми исходными данными для расчета являются значения параметров Х и Y.

 

Таблица П1

Значения параметра Х

 

Предпоследняя цифра № зачетной книжки Значения параметра
х1 х2 х3 х4 х5 х6 х7 х8 х9 х10
  0,54 0,67 0,71 0,79 0,92 0,99 1,02 1,12 1,19 1,25
  15,2 16,9 17,2 23,1 23,8 25,4 29,7 30,2 31,1 31,5
                     
                     
                     
  7,21 7,99 8,08 8,13 8,28 8,43 8,55 8,62 8,69 8,82
                     
  55,5 56,1 56,9 57,6 58,1 58,6 59,9 60,9 61,1 62,8
  0,02 0,08 0,11 0,16 0,19 0,28 0,31 0,35 0,42 0,45
                     

 

 

Таблица П2

 

Значения параметра Y

 

Предпоследняя цифра № зачетной книжки Значения параметра
y1 y2 y3 y4 y5 y6 y7 y8 y9 y10
                     
  88,7 87,2 80,5 78,9 75,4 73,1 72,8 70,8 67,3 65,2
  16,5 18,1 18,3 19,8 21,8 21,5 23,4 22,2 25,9 26,8
  1,25 1,22 1,28 1,18 1,15 1,11 1,08 1,02 1,09 0,92
                     
  33,5 30,8 29,4 29,9 27,1 26,3 27,6 25,5 24,1 23,9
                     
  6,6 6,2 6,8 7,3 8,1 7,4 6,9 7,9 8,1 8,9
  0,63 0,67 0,65 0,54 0,58 0,51 0,47 0,46 0,37 0,44
                     

 

Таблица П3

 

Значения функции F для доверительной вероятности H= (1–0,05) = 0,95

 

К1 К2
                 
  161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04
  18,54 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45
  10,18 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64
  7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77
  6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53
  5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84
  6,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41
  5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12
  5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90
  4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74
  4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,79 2,61
  4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50
  4,67 3,80 3,41 3,18 3,02 2,92 2,77 2,60 2,42
  4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35
  4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,29
  4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,42 2,24
  4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,19
  4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,34 2,15
  4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,11
  4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,28 2,08

 

К1, К2 – степени свободы случайных факторов.

 

 

Корреляционно-регрессионный анализ

экспериментальных данных

 

Методические указания к практическому занятию

 

Редактор

Техн. редактор А.В. Миних

 

Издательский центр Южно-Уральского государственного университета


Подписано в печать __.__.2014. Формат 60х84/16. Печать цифровая.

Усл. печ. л. ____ Уч.-изд. л. ____. Тираж 50 экз. Заказ ___/___Цена С.

 


Отпечатано в типографии Издательского центра ЮУрГУ.

454080, Челябинск, пр. им. В.И. Ленина, 76




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 2758; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.126 сек.