Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

ПРИМЕР. Регрессии. Эмпирические формулы




Регрессии. Эмпирические формулы.

Задача о форме корреляционной связи решается с помощью регрессий.

Регрессией Y от X называется функциональная зависимость между значениями x и соответствующими условными средними y (x). Регрессии можно представить геометрически в виде ломаных линий, соединяющих точки (x;y(x)). Эти линии называются эмпирическими (полученными из опыта) ломаными линиями регрессии.

Регрессии, полученные в виде таблиц или ломаных линий, характеризуют форму корреляционной зависимости между X и Y лишь для выборочных совокупностей. Для генеральной же совокупности они дают приближенную картину этой зависимости. Очевидно, приближение будет тем точнее, чем больше объем выборки n и чем меньше частные интервалы Dx и Dy. При этом ломаная линия регрессии будет приближаться к некоторой плавной кривой. Правда, такую плавную кривую можно получить и иначе – если ломаную линию регрессии “сгладить” посредством какой-либо известной линии (прямой, параболы, гиперболы и т.п.).

Если показателей два, то регрессия называется парной. Если зависимость между показателями Х и Y пропорциональная, то регрессия будет линейной и описывается уравнением вида y = ax + b.

 

Рассмотрим методику построения регрессионного уравнения на примере анализа веса щитовидной железы (Y) и соответствующей площади ее скенографического изображения (X).

X                        
Y                        

 

Введем эту таблицу в ячейки А1-M2 электронной книги Excel.

Просмотрим предварительно, как лежат точки на графике и какое уравнение регрессии лучше выбрать. Для этого строим график.

Вызвав мастер диаграмм, выбираем тип диаграммы «Точечная», нажимаем «Далее» и, поместив курсор в поле «Диапазон» обводим курсором данные Y (ячейки В2-М2). Переходим на закладку «Ряд» и в поле «Значения Х»

делаем ссылку на ячейки В1-М1, обводя их курсором. Нажимаем «Готово».

 

Как видно из графика, точки хорошо укладываются на прямую линию, поэтому будем находить уравнение линейной регрессии вида y = ax + b.

Для нахождения коэффициентов а и b уравнения регрессии

служат функции НАКЛОН (SLOPE) и ОТРЕЗОК (INTERCEPT) категории «Статистические».

Вводим в А5 подпись «а=» а в соседнюю ячейку В5 вводим функцию

НАКЛОН (SLOPE), ставим курсор в поле «Изв_знач_у» задаем ссылку на ячейки В2-М2, обводя их мышью. Аналогично в поле «Изв_знач_х» даем

ссылку на В1-М1. Результат 3,36. Найдем теперь коэффициент b.

Вводим в А6 подпись «b=», а в В6 функцию ОТРЕЗОК (INTERCEPT) с теми же параметрами, что и у функции НАКЛОН (SLOPE),. Результат - 42,6.

Следовательно, уравнение линейной регрессии есть y = 3,33x - 42,6.

 

Построим график уравнения регрессии. Для этого в третью строчку таблицы введем значения функции регрессии в заданных точках Х (первая строка) – . Для получения этих значений используется функция ТЕНДЕНЦИЯ (FORECAST) категории «Статистические». Вводим в

А3 подпись «Y(X)» и, поместив курсор в В3, вызываем функцию

ТЕНДЕНЦИЯ (FORECAST).

Для Excel: в полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В2-М2 и В1-М1. В поле «Нов_знач_х» вводим также ссылку на В1-М1. В поле «Константа» вводят 1, если уравнение регрессии имеет вид y = ax + b, и 0, если y = ax. В нашем случае вводим единицу. Функция ТЕНДЕНЦИЯ (FORECAST) является массивом, поэтому для вывода всех ее значений выделяем область В3-М3 и нажимаем F2 и Ctrl+Shift+Enter. Результат – значения уравнения регрессии в заданных точках.

В Calc: в поле «Значение» вводим массив В1-М1, в поле «Данные Y» - ссылку на В2-М2, в поле «Данные X» -ссылку на В1-М1. В поле «Массив» поставим флажок, нажимаем ОК и массив B3:M3 заполнится значениями, вычисленными по линейной регрессии.

Строим график.

EXCEL: Ставим курсор в любую свободную клетку, вызываем мастер диаграмм, выбираем категорию «Точечная», вид графика – линия без

точек, нажимаем «Далее», в поле «Диапазон» вводим ссылку на В3-М3. Переходим на закладку «Ряд» и в поле «Значения Х» вводим ссылку на В1-М1, нажимаем «Готово». Результат – прямая линия регрессии.

Посмотрим, как различаются графики опытных данных и уравнения регрессии. Для этого ставим курсор в любую свободную ячейку, вызываем мастер диаграмм, категория «График», вид графика – ломаная линия с точками (или точечная с прямыми отрезками), нажимаем «Далее», в поле «Диапазон» вводим ссылку на вторую и третью строки В2-М3. Переходим на закладку «Ряд» и в поле «Подписи оси Х» вводим ссылку на В1-М1, нажимаем «Готово». Результат – две линии (Синяя – исходные данные, красная – уравнение регрессии). Видно, что линии мало различаются между собой.

CALC: В график с точками вставляем линию тренда (она же линия регрессии). Для этого в области построения диаграммы нажимаем правую кнопку мыши и выбираем «вставить линию тренда».

 

Линия регрессии позволяет с некоторой вероятностью предсказать в интервале от X=11 до X=89 любые значения функции Y при отсутствущих значениях фактора X, но и за пределами данного интервала. Так, например, чтобы вычислить вес щитовидной железы, соответствующий площади скеннографического изображения равной Х=90 см3, воспользуемся встроенной статитическиой функцией ПРЕДСКАЗ (CALC?). Расчет показывает, что вес щитовидной железы будет в этом случае равен Y=259,64.

Для вычисления коэффициента корреляции служит функция КОРРЕЛ (CORREL). Размещаем графики так, чтобы они располагались выше

25 строки, и в А25 делаем подпись «Корреляция», в В25 вызываем

функцию КОРРЕЛ (CORREL), в полях которой «Массив 1» и «Массив 2» вводим ссылки на исходные данные В1-М1 и В2-М2. Результат 0,9951. Коэффициент детерминации Rxy – это квадрат коэффициента корреляции . В А26 делаем подпись «Детерминация», а в В26 – формулу «=В25*В25». Результат 0,99, т.е. 99% всех изменений одного признака связано с изменением другого.

Однако существует одна функция, которая рассчитывает

все основные характеристики линейной регрессии. Это функция ЛИНЕЙН (LINEST). Ставим курсор в В28 и вызываем функцию ЛИНЕЙН (LINEST). категории «Статистические». В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В2-М2 и В1-М1. Поле «Константа» имеет тот же смысл, что и в функции ТЕНДЕНЦИЯ, у нас она равна 1. Поле «Стат» должно содержать 1, если нужно вывести полную статистику о регрессии. В нашем случае ставим туда единицу. Функция возвращает массив размером 2 столбца и 5 строк. После ввода выделяем мышью ячейки В28- С32 и нажимаем F2 и Ctrl+Shift+Enter. Результат – таблица значений, числа в которой имеют следующий смысл:

 

Коэффициент а Коэффициент b
Стандартная ошибка Стандартная ошибка
Коэффициент детерминации Rxy Среднеквадратическое отклонение y
F – статистика Степени свободы n-2
Регрессионная сумма квадратов Остаточная сумма квадратов

 

Анализ результата:

в первой строчке – коэффициенты уравнения регрессии, сравните их с рассчитанными функциями НАКЛОН и ОТРЕЗОК.

Вторая строчка – стандартные ошибки коэффициентов.

Если одна из них по модулю больше чем сам коэффициент, то коэффициент считается нулевым. Коэффициент детерминации характеризует качество связи между факторами. Полученное значение 0,9902 говорит об очень хорошей связи факторов. F – статистика проверяет гипотезу об адекватности регрессионной модели.

 

Данное число нужно сравнить с критическим значением. Для его получения вводим в Е33 подпись «F-критическое», а в F33 функцию FРАСПОБР (FINV), аргументами которой вводим соответственно «0,05» (уровень значимости), «1»(число факторов Х) и «10» (степени свободы). Видно, что F – статистика больше, чем F– критическое, значит регрессионная модель адекватна.

 

В последней строке приведены регрессионная сумма квадратов и остаточные суммы квадратов. Важно, чтобы регрессионная сумма (объясненная регрессией) намного больше остаточной (не объясненная регрессией, вызванная случайными факторами). В нашем случае это условие выполняется, что говорит о хорошей регрессии.

 

 

Задание. Даны выборки факторов xi и yi. По этим выборкам:

1) Построить эмпирическую линию регрессии (ломаную линию).

2) Найти уравнение линейной регрессии.

3) Найти коэффициент парной корреляции, коэффициент детерминации.

4) Проверить на уровне значимости a = 0,05 регрессионную модель на адекватность.

Вариант 1, 7

Средняя длина тела плода (см)                  
Возраст внутри утробного плода(нед)                  

Вариант2, 8

Площадь поражения артерии таза (%) 22,3 3,1 48,3   7,5 40,2 23,1   32,5  
Возраст (в годах)                    

Вариант 3, 9

Содержание андростерона в моче(мг/в сут) 0,82 0,9 0,98 1,06 1,2 1,29 1,48 1,42 1,4 1,08
Возраст (в годах)                    

Вариант 4, 10

Концентрация пролактина в крови (нг/мл)                    
Возраст (в годах)                    

Вариант 5, 11

Поверхность тела (м2) 1,1 1,5 1,2 1,3 1,9 1,3   1,7 1,5 1,7
Вес(кг)                    

Вариант 6, 12

Объем циркулирующей крови (л) 4,83 5,08 3,81 5,34 4,06 5,34 4,32 5,59 4,57 5,8
Рост (см)                    

 

Замечание: При решении задачи выборку (Xi;Yi) целесообразно занести в электронную таблицу по возрастанию значений фактора X.

 

Контрольные вопросы к лабораторной работе:

1.

 

 

                       
  6,7     10,0              
  5,2     9,1              
  13,5     6,3              
  3,9     7,2              
  9,8     9,3              
  6,3     10,7              
  6,3     2,6              
  2,6     4,9              
  5,1     8,3              
  5,5     3,7              
  7,4     7,1              
  3,9     7,9              
  6,4     5,3              
  4,7     5,8              




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 1612; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.025 сек.