Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Регрессионного анализа. Составление планов эксперимента для проведения классического




Составление планов эксперимента для проведения классического

Регрессионного анализа

Составление планов эксперимента для проведения

Некоторые общие положения регрессионного анализа

Планирование эксперимента для применения регрессионного анализа

Регрессионный анализ (РА) - метод математической статистики, который позволяет выявить приближенную количественную зависимость (f) свойства объекта y от значений факторов x j, оказывающих влияние на это свойство. Эта приближенная зависимость, выраженная в виде конкретной математической функции, называется уравнением регрессии:

.

Проводить РА можно только для количественных значений y и x j.

При РА решают две основные задачи:

1. Ищут с помощью метода приближения уравнение регрессии, наиболее точно описывающее истинную зависимость y = j(x j) по результатам измерения свойств объекта при различных значениях факторов:

y = j(x 1, x 2,..., x j,... x k) + e = f(x 1, x 2,..., x j,... x k) + q + e.

2. Оценивают ошибки (q + e), допускаемые при описании истинной зависимости j с помощью найденного уравнения регрессии.

Порядок проведения РА (его тип) зависит от плана эксперимента. Различают классический РА (КРА) и РА при математическом планировании эксперимента (РАМПЭ).

Общим требованием к планированию любого эксперимента для проведения КРА является выполнение условия mj > 2. Другие рекомендации аналогичны планированию эксперимента для проведения дисперсионного анализа.

После планирования и завершения эксперимента проведение КРА его результатов проводят в такой последовательности:

Выбирают семейство математических функций, в котором предполагается найти уравнение регрессии (семейство прямых, парабол, гипербол и др.).

Выбирают метод приближения.

Для выбранного семейства функций с помощью метода приближения рассчитывают параметры функции (коэффициенты уравнения регрессии).

Проверяют рассчитанные коэффициенты уравнения регрессии на значимость (равенство нулю).

Корректируют вид исходной функции, исключая из нее незначимые коэффициенты и другие составляющие.

Рассчитывают параметры скорректированной функции (скоррек­тированные коэффициенты уравнения регрессии) и возвращаются к выполнению пунктов 4,5. Пункт 6 выполняют до тех пор, пока в уравнении регрессии останутся только значимые коэффициенты (значения коэффициентов могут изменяться после каждого пересчета)

Оценивают ошибки (q + e), допускаемые при описании истинной зависимости j с помощью найденного уравнения регрессии: проверяют адекватность уравнения регрессии с помощью закона распределения Фишера или рассчитывают вероятность описания зависимости j функцией f.

Выбирают другое семейство математических функций и (или) метод приближения и с ними последовательно выполняют пункты 3-7.

Из группы найденных уравнений регрессии в ряду разных семейств функций выбирают окончательное уравнение регрессии по следующим соображениям:

а) вид данного уравнения регрессии совпадает с теоретическими законами поведения объекта;

б) данное уравнение регрессии описывает поведение объекта с наибольшей вероятностью;

в) при одной вероятности для данного уравнения регрессии наблюдается наибольшее значение соотношения факторной и остаточной дисперсий (F-соотношения).

При выборе семейства функций (пункты 1 и 8), если нет сведений или теоретических предположений о типе зависимости j, обычно действуют по принципу "от простого к сложному". При этом начинают с семейства прямых ("линейная регрессия") или трансцендентных функций, которые легко преобразуются в линейную форму ("трансцендентная регрессия").

При неадекватности найденного линейного уравнения регрессии или неудовлетворенности его точностью можно переходить к семейству полиномов с постепенным увеличением их степени (полиномы второго, третьего и др. порядков) до тех пор, пока не начнет уменьшаться F-соот­ношение. Вид функции также зависит от числа одновременно изменяемых факторов при эксперименте.

Наиболее часто при выполнении РА в качестве метода приближения используют метод наименьших квадратов (МНК). Однако применение МНК является корректным при выполнении следующих требований:

а) единичные результаты измерения свойств y должны быть независимыми случайными величинами;

б) выборочные дисперсии y z должны быть однородными (одинаковыми).

При невыполнении этих условий используют другие методы приближения (непараметрические методы регрессии).

Алгоритмы всех необходимых при КРА расчетов (пункты 3,4,6,7) зависят от выбранного семейства функций, метода приближения, наличия повторных опытов, количества исследуемых факторов (изучить самостоятельно [6,7,8,11]). Многие из этих алгоритмов реализованы в статистических программных продуктах, математических пакетах (MathCAD и др.), электронных таблицах (E x cel и др.).

Следует отметить, что выполнение пункта 9 носит субъективный характер и для него пока еще нет общепризнанных рекомендаций.

Пример проведения классического регрессионного анализа. Воспользуемся для примера данными эксперимента, приведенными в табл. 7.

По полю корреляции (см. рис. 4) можно предположить линейный характер зависимости y от х, поэтому начнем проведение КРА с выбора семейства прямых и представления искомого уравнения регрессии в виде

= а + b x.

Так как в этом эксперименте не проводились повторные опыты, то невозможно оценить однородность дисперсий при различных уровнях фактора х и установить закон распределения y. Поэтому делаем допущение о нормальном законе распределения y и равенстве дисперсий (одинаковой случайной ошибке при любом значении х). Тогда в качестве метода приближения можно взять МНК.

Используя метод МНК и учитывая отсутствие повторных опытов, выполним расчеты коэффициентов уравнения регрессии а и b [1]:

 


b = 1,3 (мас. %/мин); a = ` y - b` x = 42,5 - 1,3×115; а = - 107 (мас. %).

Так как дисперсия воспроизводимости эксперимента неизвестна и ее невозможно определить (из-за отсутствия повторных опытов), то проверку коэффициентов а и b на значимость не проводим. Делаем допущение, что эти коэффициенты "значимы", т.е. не равны нулю.

Найденное линейное уравнение регрессии имеет следующий вид:

= - 107 + 1,3 х.

Для оценки ошибки, допускаемой при описании истинной зависимости j с помощью найденного уравнения регрессии при отсутствии повторных опытов и дисперсии воспроизводимости, составим F-соотно­шение (Fp) между дисперсией относительно` y () и остаточной дисперсией () в соответствии со следующими формулами:

; ; ,

где L - число значимых коэффициентов в скорректированном уравнении регрессии (L = 2).

Выполним необходимые расчеты:

,

» 290 (мас. %)2;

,

15 (мас. %)2;

;

% = 95 %;

(где R - выборочный корреляционный коэффициент Пирсона, R2 - коэффициент детерминации).

Найденное линейное уравнение регрессии ( = - 107 + 1,3 х) с вероятностью, большей 0,95, адекватно описывает реальную зависимость выхода нитробензола от времени его синтеза, так как значение соотношения Fp больше табличного значения квантиля распределения Фишера при a=0,05 и степенях свободы f1 = N-1 и f2 = N-L (Fт = 19,2). Точность описания (коэффициент детерминации R2) реальной зависимости найденным линейным уравнением регрессии составляет 95 %.

Подобные расчеты были выполнены на ПЭВМ с помощью статистического пакета STATGRAPHICS [7] не только для семейства прямых, но и некоторых других функций (табл. 15).

Данные табл. 15 показывают, что выход нитробензола зависитот времени его синтеза и эта зависимость с наибольшей вероятностью (Р» 0,983) описывается линейным уравнением вида

= - 107 + 1,3 х.

Оба коэффициента уравнения регрессии (а = - 107 и b = 1,3) с вероятностью Р > 0,96 являются "значимыми" (т.е. не равными нулю), так как уровень их значимости равен соответственно aа = 0,033 и ab = 0,017.

Таблица 15

Результаты расчетов на ПЭВМ

Функ­ция Коэф­фици­ент F-соотношени­е Адекват-­ но­сть (a)
обо­з­на­­че­ние значе­ние S tт a
y = a + b x a b - 107 1,3 20,013 0,173 - 5,347 7,506 0,033 0,017 56,33   0,017  
y = e(a+b x) a b - 0,3741 0,03519 0,9969 0,0086 -0,375 4,078 0,744 0,055 25,88   0,055  
1/ y = a + b x a b 0,14867 -0,00105 0,0423 0,0004 3,5128 -2,867 0,072 0,103 11,07   0,103  

Более подробно с проведением классического регрессионного анализа для практических целей можно ознакомиться в [11].




Поделиться с друзьями:


Дата добавления: 2015-06-26; Просмотров: 983; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.