Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Составление планов эксперимента для проведения




Регрессионного анализа

Составление планов эксперимента для проведения

Некоторые общие положения регрессионного анализа

Регрессионного анализа

Планирование эксперимента для применения

 

 

Регрессионный анализ (РА) – метод математической статистики, позволяющий выявить приближенную количественную зависимость (f) свойства объекта y от значений факторов xj, оказывающих влияние на это свойство. Эта приближенная зависимость, выраженная в виде конкретной математической функции, называется уравнением регрессии:

ŷ = f(x1 , x2, …, xj,…xk).

 

Проводить РА можно только для количественных значений y и xj.

При РА решают две основные задачи:

1) ищут с помощью метода приближения уравнение регрессии, наиболее точно описывающее истинную зависимость y = j(xj) по результатам измерения свойств объекта при различных значениях факторов:

y = j (x 1, x 2,..., x j,... x k) + e = f (x 1, x 2,..., x j,... x k) + q + e,

 

где e – случайные ошибки эксперимента, q – ошибки, связанные с несовпадением уравнения регрессии с истинной зависимостью j;

2) оценивают суммарные ошибки (q + e).

Порядок проведения регрессионного анализа (его тип) зависит от плана эксперимента. Различают классический регрессионный анализ (КРА) и регрессионный анализ при математическом планировании эксперимента (РАМПЭ).

 

 

классического регрессионного анализа

 

Общим требованием к планированию любого эксперимента для проведения КРА является выполнение условия mj > 2. Другие рекомендации аналогичны планированию эксперимента для проведения дисперсионного анализа.

После планирования и завершения эксперимента проведение КРА результатов эксперимента проводят в следующей последовательности.

Выбирают семейство математических функций, в котором предполагается найти уравнение регрессии (семейство прямых, парабол, гипербол и др.).

Выбирают метод приближения.

Для выбранного семейства функций методом приближения рассчитывают параметры функции (коэффициенты уравнения регрессии).

Проверяют рассчитанные коэффициенты уравнения регрессии на значимость (равенство нулю).

Корректируют вид исходной функции, исключая из нее незначимые коэффициенты и другие составляющие.

Рассчитывают параметры скорректированной функции (скоррек­тированные коэффициенты уравнения регрессии) и возвращаются к выполнению пп. 4, 5. Затем п. 6 выполняют до тех пор, пока в уравнении регрессии останутся только значимые коэффициенты (значения коэффициентов могут изменяться после каждого пересчета).

Оценивают суммарные ошибки (q + e), проверяют адекватность уравнения регрессии с помощью закона распределения Фишера или рассчитывают вероятность описания зависимости j функцией f.

Выбирают другое семейство математических функций и (или) метод приближения и с ними последовательно выполняют пп. 3-7.

Из группы найденных уравнений регрессии в ряду разных семейств функций выбирают окончательное уравнение регрессии по следующим соображениям:

а) вид данного уравнения регрессии совпадает с теоретическими законами поведения объекта;

б) данное уравнение регрессии описывает поведение объекта с наибольшей вероятностью;

в) при одной вероятности для данного уравнения регрессии наблюдается наибольшее значение соотношения факторной и остаточной дисперсий (F-соотношения).

При выборе семейства функций (пп. 1 и 8), если нет сведений или теоретических предположений о типе зависимости j, обычно действуют по принципу "от простого к сложному". При этом начинают с семейства прямых ("линейная регрессия") или трансцендентных функций, которые легко преобразуются в линейную форму ("трансцендентная регрессия").

При неадекватности найденного линейного уравнения регрессии или неудовлетворенности его точностью можно переходить к семейству полиномов с постепенным увеличением их степени (полиномы второго, третьего и др. порядков) до тех пор, пока не начнет уменьшаться F-соотношение.

Наиболее часто при выполнении РА в качестве метода приближения используют метод наименьших квадратов (МНК). Однако применение МНК является корректным при выполнении следующих требований:

а) единичные результаты измерения свойств y должны быть независимыми случайными величинами;

б) выборочные дисперсии всех опытов в эксперименте должны быть однородными (одинаковыми).

При невыполнении этих условий используют другие методы приближения (непараметрические методы регрессии).

Алгоритмы всех необходимых при КРА расчетов (пп. 3, 4, 6, 7) зависят от выбранного семейства функций, метода приближения, наличия повторных опытов, количества исследуемых факторов [3, 4, 11, 12]. Многие из этих алгоритмов реализованы в статистических программных продуктах, математических пакетах (MathCAD и др.), электронных таблицах (Excel и др.).

Следует отметить, что выполнение п. 9 носит субъективный характер и для него пока еще нет общепризнанных рекомендаций.

Пример. Воспользуемся для примера данными эксперимента, приведенными в табл. 6.

По полю корреляции (см. рис. 4) можно предположить линейный характер зависимости y от х, поэтому начнем проведение КРА с выбора семейства прямых и представления искомого уравнения регрессии в виде

ŷ = а + bx.

Так как в этом эксперименте не проводились повторные опыты, то невозможно оценить однородность дисперсий при различных уровнях фактора х и установить закон распределения y. Поэтому делаем допущение о нормальном законе распределения y и равенстве дисперсий (одинаковой случайной ошибке при любом значении х). Тогда в качестве метода приближения можно взять МНК.

Используя метод МНК и учитывая отсутствие повторных опытов, выполним расчеты коэффициентов уравнения регрессии а и b [4]:

;

 

;

b = 1,3 (% мас. /мин); a = `y - b`x = 42,5 – 1,3×115;

а = – 107 (% мас.).

Так как дисперсия воспроизводимости эксперимента неизвестна и ее невозможно определить (из-за отсутствия повторных опытов), то проверку коэффициентов а и b на значимость не проводим. Делаем допущение, что эти коэффициенты "значимы", т.е. не равны нулю.

Найденное линейное уравнение регрессии имеет следующий вид:

ŷ = – 107 + 1,3 х.

Для оценки ошибки, допускаемой при описании истинной зависимости j с помощью найденного уравнения регрессии при отсутствии повторных опытов и дисперсии воспроизводимости, составим F-соотношение (Fp) между суммой квадратов относительно `y (SSy) и остаточной дисперсией () в соответствии со следующими формулами:

; ; SSx = SSy – SSост.;

 

; ,

где N – общее число опытов; L – число значимых коэффициентов в скорректированном уравнении регрессии (L = 2).

Выполним необходимые расчеты:

SSy = 875 (мас. %)2;

 

;

SSост. = 30 % мас.; SSx = SSy – SSост. = 875–30 = 845 % мас.;

 

% мас.;

 

;

 

;

,

где R2 – коэффициент детерминации, R – выборочный коэффициент корреляции Пирсона (выборочный коэффициент парной линейной корреляции ryx.

Найденное линейное уравнение регрессии (ŷ = – 107 + 1,3 х) с вероятностью, большей 0,95, адекватно описывает реальную зависимость выхода нитробензола от времени его синтеза, так как значение соотношения Fp больше табличного значения квантиля распределения Фишера при a = 0,05 и степенях свободы f1 = N1 и f2 = NL (Fт = 19,2 [4,6]). Точность описания (коэффициент детерминации R2) реальной зависимости найденным линейным уравнением регрессии составляет 98 %.

Подобные расчеты были выполнены на ПЭВМ с помощью программы Excel не только для семейства прямых, но и некоторых других функций (табл. 13).

Таблица 13

Итоги классического регрессионного анализа

Функция Коэффициент F- соот- но-ше- ние Адек- ват-­ ность ŷ(a)
Обоз­наче­ние Значение Стандартная ошибка, S t-статистика a
y = a + bx a b - 107 1,3 20,013 0,173 - 5,347 7,506 0,033 0,017 56,33 0,017
y = e(a+bx) a b - 0,3741 0,03519 0,9969 0,0086 -0,375 4,078 0,744 0,055 16,63 0,055
1/y = a + bx a b 0,14867 -0,00105 0,0423 0,0004 3,5128 -2,867 0,072 0,103 8,22 0,103

Данные табл. 13 показывают, что оба коэффициента уравнения регрессии (а = – 107 и b = 1,3 ) с вероятностью Р > 0,96 являются "значимыми" (т.е. не равными нулю), так как уровень их значимости равен aа = = 0,033 и ab = 0,017, соответственно.

Таким образом выход пентозанов зависит от времени гидролиза березовых опилок и эту зависимость с наибольшей вероятностью (Р» 0,983) можно описать линейным уравнением вида

ŷ = – 107 + 1,3 х.

 

Более подробно с проведением КРА для практических целей можно ознакомиться в [3, 4, 12].

 




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 453; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.