Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Регрессионного анализа 1 страница




Особенности обработки результатов эксперимента методом

3.3.1 Особенности расчета коэффициентов регрессии

Существенно новые возможности открылись после того, как в регрессионный анализ были привнесены идеи планирования эксперимента. Так, при ортогональном планировании матрица коэффициентов нормальных уравнений становится диагональной, и ее диагональные элементы равны числу опытов N в матрице планирования. Это резко уменьшает трудности, связанные с расчетом коэффициентов уравнения регрессии. В связи с тем, что ковариационная матрица также является диагональной, все коэффициенты уравнения регрессии будут некоррелированы между собой. В этом случае значимость коэффициентов можно проверять для каждого из них в отдельности и, соответственно, исключение из уравнения регрессии любого незначимого коэффициента никак не скажется на остальных. При этом коэффициенты bi будут являться несмешанными оценками для соответствующих генеральных коэффициентов , и их величины будут характеризовать вклад каждого фактора в выходной параметр Y. Кроме того, следует отметить, что диагональные элементы ковариационной матрицы будут равны между собой, поэтому все коэффициенты регрессии bi будут определяться с одинаковой точностью. С учетом сказанного, при обработке результатов активного эксперимента коэффициенты уравнения регрессии по методу наименьших квадратов будут определяться следующим образом:


 

. . (3.26)

 

Из выражения (3.26) следует, что любой коэффициент уравнения регрессии bi определяется скалярным произведением столбца y на соответствующий столбец xi деленным на число опытов N в матрице планирования:

 

. (3.27)

 

Вычислив вектор В и записав уравнение приближенной регрессии, приступают к его статистическому анализу.

 

3.3.2 Особенности статистического анализа уравнения регрессии

 

Так же, как и при обработке результатов пассивного эксперимента, статистический анализ начинают с проверки адекватности уравнения приближенной регрессии результатам эксперимента. Адекватность уравнения проверяется по критерию Фишера:

 

. (3.28)

 

При этом сравниваются между собой дисперсия адекватности и дисперсия воспроизводимости . Рассмотрим физический смысл и причины использования в зависимости (3.28) оценок дисперсий и .

Если бы заранее нам было известно, что полученная математическая модель адекватно описывает процесс, то в качестве оценки дисперсии адаптивной помехи (шума эксперимента) можно было бы взять остаточную дисперсию (смотреть 3.23) . В этом случае, согласно (3.19) для проверки адекватности следовало бы воспользоваться отношением остаточной дисперсии к дисперсии воспроизводимости .

То есть для адекватной модели единственной причиной различий между фактическим значением отклика и предсказанным по уравнению регрессии может быть влияние шума . Именно поэтому остаточная дисперсия служит оценкой для . В случае, когда математическая модель неадекватна, остаточная дисперсия будет оценивать одновременно и плюс еще некоторую дополнительную компоненту рассеяния, обусловленную неадекватностью модели.

Но так как адекватность модели нам заранее не известна, то оценку дисперсии аддитивной помехи на практике определяют по результатам параллельных опытов (повторных наблюдений при одинаковых значениях входных факторов). Эту оценку принято называть дисперсией воспроизводимости .

Исходя из вышеизложенного, дисперсия адекватности в зависимости (3.28) может быть определена следующим образом:

 

, (3.29)

 

где – сумма квадратов адекватности;

– число степеней свободы дисперсии адекватности;

– число оценок коэффициентов в уравнении приближенной регрессии (линейный случай);

– остаточная сумма квадратов;

– сумма квадратов, связанная с дисперсией воспроизводимости;

– число степеней свободы остаточной дисперсии;

– число степеней свободы дисперсии воспроизводимости.

 

Вид расчётных зависимостей для оценок дисперсий, входящих в (3.28), существенно зависит от порядка проведения активного эксперимента. Следует выделить следующие четыре случая. Случай первый соответствует условиям эксперимента, когда в каждой ячейке матрицы планирования проведено неравное число параллельных опытов, то есть:

.

 

Для данного, наиболее общего случая дисперсия адекватности может быть определена по зависимостям:

 

, (3.30)

 

где ;

 

 

 

 

;

 

 

 

Второй случай соответствует условиям эксперимента, когда в каждой ячейке матрицы планирования проведено равное число параллельных опытов, то есть:

 

.

 

Данное условие существенно упрощает расчёты, поэтому, проводя активный эксперимент, исследователь, как правило, стремится к его выполнению. В рассматриваемых условиях оценки дисперсий имеют вид:

. (3.31)

 

Третий случай соответствует условиям, когда по какой-либо причине параллельные опыты в каждой ячейке матрицы планирования не были проведены. В данных условиях для определения оценок дисперсий целесообразно поставить дополнительную серию из l-го опыта в центре плана эксперимента (когда исследуемые входные факторы находятся на базовых уровнях). В этом случае

 

, (3.32)

 

где

– значение выходного параметра в γ-м эксперименте для базового уровня входных факторов.

 

Для учета различных вариантов дублирования опытов при практическом решении задач можно пользоваться таблицей 3.3.

Четвертый случай соответствует условиям, когда параллельные опыты не проводились, и дополнительный эксперимент в центре планов по какой-либо причине поставить не удалось. В этом случае качество аппроксимации опытных данных, полученным уравнением приближенной регрессии, можно оценить, сравнив по критерию Фишера остаточную дисперсию S2ост . и относительно среднего S2у , то есть:

 

(3.33)

 

 

где f1=N - 1 – число степеней свободы дисперсии относительно среднего S2y;

f2=N - h – число степеней свободы остаточной дисперсии.


Таблица 3.3 – Суммы квадратов и число степеней свободы при различных вариантах дублирования опытов.

Источник Рассеяния Характер дублирования опытов Суммы квадратов Число степеней свободы
Ошибка эксперимента Неравномерный
Равномерный
Дублирование в одной точке плана (например, j=1)
Дублирование в отдельной серии из l опытов (например, в центре плана)
Неадекватность модели Неравномерный fад=N-h
Равномерный fад=N-h
Дублирование в одной точке плана (например, j=1) fад=N-h
Дублирование в отдельной серии из l-го опыта (например, в центре плана) fад=N-h

 
 


Таким образом, рассчитав оценки дисперсий воспроизводимости S2воспр и адекватности S2ад по зависимости (3.30), (3.31) или (3.32), вычисляют по формуле (3.28) расчетное значение F – критерия и сравнивают его с табличным Fтабл. (α, f1, f2), определенным для уровня значимости α и чисел степеней свободы f1 числителя и f2 знаменателя в формуле (3.28).

Если выполняется условие

 

 

то нет оснований сомневаться в адекватности полученного уравнения приближенной регрессии результатам эксперимента.

Если же

 

 

то следует сделать вывод о неадекватности полученной модели и принять меры по ее совершенствованию (например, выбрать полином более высокого порядка или осуществить нелинейное преобразование факторов) с тем, чтобы в конечном итоге получить модель, адекватно отражающую свойства исследуемой системы.

При проверке адекватности уравнения приближенной регрессии по зависимости (3.33) следует помнить, что критериальное отношение показывает, во сколько раз уменьшается рассеяние относительно полученного уравнения регрессии по сравнению с рассеянием относительно среднего. Поэтому, чем больше значение Fрасч ., полученное по формуле (3.33), будет превышать табличное Fтабл. (α, f1, f2) определенное для уровня значимости α и чисел степей свободы f1 – числителя и f2 – знаменателя в формуле (3.33) тем эффективнее будет уравнение приближенной регрессии.

Получив адекватное уравнение приближенной регрессии, приступают к проверке значимости оценок коэффициентов регрессии. Задача данной проверки, также как и при обработке пассивных экспериментов, заключается в установлении статистической значимости или не значимости отличия оценок коэффициентов регрессии от нуля. В результате этого мы устанавливаем, обусловлено ли отличие bi от нуля чисто случайным влиянием помехи ε (шума эксперимента) или же это отличие не случайно и вызвано тем, что в истинной регрессионной модели присутствует соответствующий коэффициент регрессии .

Оценка значимости коэффициентов производится по t – критерию Стьюдента:

, (3.34)

 

где – оценка среднего квадратического отклонения коэффициента bi.


Как было отмечено выше, для активного (спланированного) эксперимента все коэффициенты уравнения приближенной регрессии определяются с одинаковой точностью. В случае, когда параллельные опыты отсутствуют, ее можно определить по формуле:

 

. (3.35)

 

Для различных условий проведения активного эксперимента оценка дисперсии воспроизводимости в формуле (3.35) должна быть рассчитана по зависимостям (3.30), (3.31) или (3.32).

Проверка значимости сводится к последовательной проверке нулевой гипотезы H0 и конкурирующей гипотезы H 1:

 

 

С этой целью расчетное значение t – критерия ti расч для i- й оценки коэффициента регрессии bi сравнивается с табличным, критическим значением tтабл.(α, f), взятым для уровня значимости α, и числа степеней свободы f=fвоспр . Если выполняется условие

 

tiрасч. > tтабл. (α, f),

то нулевая гипотеза H0 принимается. В этом случае коэффициент bi cчитают статистически не значимым, а его отличие от нуля объясняется лишь действием чисто случайных обстоятельств. Следовательно. Данный коэффициент из уравнения приближенной регрессии может быть исключен при условии, что у исследователя нет никаких дополнительных доводов в пользу его сохранения. Как было сказано выше, при обработке результатов активного (спланированного) эксперимента исключение из уравнения регрессии любого числа незначимых коэффициентов никак не отражается на оставшихся, следовательно, никаких дополнительных перерасчетов делать не следует.

После исключения всех незначимых коэффициентов следует вновь проверить адекватность уравнения приближенной регрессии и, если оно осталось адекватным, можно приступить к его интерпретации.


Примечание. Иногда в процессе исследований встречается случай, когда проверка адекватности полученного уравнения приближенной регрессии становится невозможной. Как правило, это бывает тогда, когда N вариантов варьирования плана полнофакторный эксперимент (ПФЭ) равно числу всех оценок коэффициентов в проверяемом уравнении регрессии. В этом случае знаменатель в зависимостях для расчета дисперсии адекватности обращается в нуль и степеней свободы для проверки гипотезы об адекватности математической модели результатам эксперимента не остается.

В рассматриваемых условиях целесообразно в первую очередь проверить значимость коэффициентов уравнения приближенной регрессии, так как, отбросив незначимые из них, мы получим дополнительные степени свободы для проверки адекватности. Если же все оценки коэффициентов регрессии окажутся значимыми, то есть будут выполняться условия

 

N = h;

fад = N - h =0,

то в данном случае, очевидно, более корректно будет уменьшить интервалы варьирования входных факторов и вновь провести эксперимент либо сразу перейти к более сложной модели, выбрав полином более высокой степени.

 

3.3.3 Интерпретация уравнения регрессии

 

Проводя статистический анализ и получив адекватное уравнение приближенной регрессии, приступают к его интерпретации. Под интерпретацией обычно понимают перевод полученной математической модели (уравнения регрессии) на язык экспериментатора. Задача интерпретации достаточно сложна и многообразна, однако общие рекомендации могут быть сведены к следующему.

Сначала устанавливают, в какой мере каждый из входных исследуемых факторов системы влияет на выходной параметр (параметр оптимизации). Модуль коэффициента регрессии – это количественная мера данного влияния. О характере влияния входных факторов говорят знаки коэффициентов регрессии. Знак «+» свидетельствует о том, что с увеличением значения данного входного фактора будет расти и величина выходного параметра системы; при знаке «–» увеличение значения данного фактора приведет к уменьшению выходного параметра (параметра оптимизации).

Проведя анализ коэффициентов при всех линейных эффектах. Переходят к интерпретации коэффициентов при парных взаимодействиях факторов. Физически взаимодействие между факторами означает, что изменение выходного параметра У на различных уровнях одного входного фактора не одинаково для всех уровней другого входного фактора. Характер влияния парных взаимодействий на выходной параметр системы также определяется знаком соответствующего коэффициента регрессии.


При этом, если знак «+», то одновременное увеличение или уменьшение данных факторов вызывает увеличение выходного параметра. Для его уменьшения необходимо одновременно изменять величины факторов в различных направлениях.

Если эффект взаимодействия имеет знак «–», то одновременно увеличение или уменьшение факторов вызывает уменьшение выходного параметра. Для его увеличения необходимо одновременно изменять величины данных факторов в разных направлениях.

Интерпретацию коэффициентов при взаимодействиях более высокого порядка, как правило, не проводят из-за сложности понимания их физической сущности.

После интерпретации результатов моделирования переходят к принятию решений о дальнейших исследованиях. При этом количество возможных ситуаций перечислить невозможно. Остановимся лишь на наиболее часто встречающихся.

1 Если линейная модель адекватна и коэффициенты регрессии значимы, то можно либо закончить исследование, либо продолжить с целью подробного исследования области оптимума.

2 Если линейная модель адекватна, а большая часть коэффициентов уравнения регрессии незначима, то можно либо изменить интервал варьирования факторов, либо отсеять незначимые факторы, либо увеличить число параллельных опытов, а если область оптимума близка, то можно закончить исследования.

Необходимо подчеркнуть, что изменение интервалов варьирования приводит к изменению коэффициентов регрессии. Абсолютные величины коэффициентов регрессии увеличиваются с увеличением интервалов. Не изменяются лишь знаки коэффициентов, однако и они могут измениться на противоположные, если при движении мы «перешагнули» экстремальную точку.

3 Если линейная модель адекватна, а все коэффициенты уравнения регрессии незначимы, кроме b0, необходимо либо увеличить точность эксперимента, либо расширить интервалы варьирования. Если область оптимума близка, то можно закончить исследование.

4 Если линейная модель неадекватна, это значит, что не удается аппроксимировать поверхность отклика плоскостью. В этом случае изменяют (уменьшают) интервалы варьирования, выбирают другую точку в качестве базового уровня, либо используют нелинейную модель. Если область оптимума близка, то можно закончить исследование.

5 Особый случай имеет место при использовании насыщенных планов. При значимости всех коэффициентов (линейных и нелинейных) ничего нельзя сказать об адекватности при неадекватности модели, так как в этом случае невозможно рассчитать дисперсию адекватности, в силу того, что число степеней свободы будет равно нулю.

В этом случае при близости области оптимума можно закончить исследование, а в противном случае – продолжить.


В случае продолжения исследования с целью изучения области оптимума наиболее распространенными методами являются:

Метод Гаусса – Зейделя и метод «крутого восхождения» Бокса-Уилсона. Второй метод является более предпочтительным, так как дает возможность найти оптимальную область за меньшее число опытов.

Закончив интерпретацию уравнения регрессии и приняв решение на окончание исследований, целесообразно осуществить обратный переход от кодированных факторов xi к натуральным переменным zi(1). Переход можно осуществить по линейному преобразованию вида

 

 

где zi – значение i – го входного фактора в натуральном масштабе;

zi0 – базовый уровень i-го входного фактора в натуральном масштабе;

– интервал варьирования i-го входного фактора в натуральном масштабе.

 

Следует отметить, что после осуществления обратного перехода заменятся величины и знаки коэффициентов уравнения приближенной регрессии и пропадет возможность интерпретации влияния факторов по величине и знакам данных коэффициентов. Однако появляется возможность исследования поведения выходного параметра в зависимости от натуральных величин входных факторов без проведения экспериментов с изучаемой системой.

При этом следует, остановиться ещё на одной важной проблеме, которая связана с обработкой результатов активного эксперимента, проведённого на ЭВМ с помощью математической или имитационной модели исследуемой системы.

Эта проблема состоит в определении пространства выводов о реальной системе, сделанных на основе данных модели, или насколько смело можно использовать полученные выводы и результаты.

Так как математическая или имитационная модель никогда не бывает тождественна реальной системе и не передаёт всех её свойств и особенностей, то и результаты, полученные при анализе модели, всегда носят для объекта приближенный характер. Их точность определяется степенью соответствия, адекватности модели и объекта. Поэтому, делая определённые выводы и давая практические рекомендации, мы должны постоянно помнить, что они с достаточной степенью достоверны лишь в тех ограничениях, в которых была разработана наша математическая (имитационная) модель, и в тех интервалах варьирования входных факторов системы, в которых проводился вычислительный (имитационный) эксперимент.


Задача.

Оценить характер и величину влияния ошибок определения основных баллистических параметров – начальной скорости полёта снаряда , угла бросания , баллистического коэффициента на отклонение центра группирования снарядов от точки прицеливания по дальности при стрельбе из 152-мм С1` 2С3 на заряде первом, снарядом 540. Начальные значения исследуемых входных факторов и срединные ошибки их определения, по данным таблиц стрельбы ТС РГ 153, соответственно равны:

 

= 603 м/с; E [dV0] = 0,23 % V0 = 1,39 м/с;

= 45 град; E [dq0] = 0,25 тыс. = 0,015 град.;

= 0,5232; E[dC] = 0.72 % C = 0,0038.

 

Задачу исследования решить на основе проведения вычислительного эксперимента с использованием математической модели движения центра масс артиллерийского снаряда. С этой целью спланировать и провести ПФЭ и обработать его результаты методом множественного регрессионного анализа.

Решение

1 Выполняем мероприятия этапа предпланирования эксперимента.

Согласно задаче исследования, необходимо оценить влияние ошибок определения трёх независимых входных факторов , и на выходной параметр – отклонение центра группирования снарядов от точки прицеливания по дальности . С этой целью на начальном этапе исследования попытаемся аппроксимировать поверхность отклика математической моделью вида:

 

. (3.36)

 

Следовательно, каждый из входных факторов моно варьировать только на двух уровнях – верхнем и нижнем, а количество опытов N будет равно 8:

 

N = 23 = 8.

 

Для определения дисперсии воспроизводимости экспериментов проведём по три параллельных опыта в каждой точке плана. За центр плана – базовый уровень – принимаем начальные значения исследуемых факторов. Интервал варьирования входных факторов выбираем широкий и равный четырём срединным ошибкам определения исследуемых входных факторов. Значения перечисленных параметров в натуральном масштабе приведены в таблице 3.3.


Таблица 3.3 – Исходный статистический материал в натуральном масштабе

Уровни факторов Входные факторы
, м/с , град С
Базовый уровень     0,5232
Интервал варьирования 5,560 0,06 0,0152
Верхний уровень 608,56 45,06 0,5384
Нижний уровень 597,44 44,94 0,5080

 




Поделиться с друзьями:


Дата добавления: 2014-11-29; Просмотров: 537; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.098 сек.