Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Последовательность построения статистических моделей

Различают два способа построения статистических регрессионных моделей: для активного и пассивного экспериментов. Рассмотрим последовательность построения регрессионной модели для активного эксперимента.

1. Постановка задача и выбор функции отклика - зависимой переменной y..Здесь устанавливается функциональная зависимость между откликом y и независимыми переменными (факторами) - Xi.

Эта зависимость (функция) может быть линейной или нелинейной. Например:

y=b0+b1X1+b2X2+ b3X3+… (3.67)

Это линейная многофакторная модель.

y=b0+b1X1+b2X22+ b3X33+… (3.68)

Это нелинейная многофакторная модель.

Если заранее (из теории) известна функциональная зависимость y от Хi, то регрессионная модель должна строиться в соответствии с этой зависимостью.

Если функция y=j(X1;X2;X3…) заранее неизвестна, то построение регрессионной модели начинают с простейшей линейной регрессионной модели (3.67).

2. Выбор факторов Xi, влияющих на y. Выбор факторов (независимых переменных) Xi осуществляется на основе функционирования системы или процесса. Оптимальное число факторов должно быть 3 - 4.

В этом случае обеспечивается минимальная погрешность эксперимента. В некоторых случаях отдельные факторы целесообразно "заморозить" К таким факторам можно отнести температуру - Т°С, углы возвышения (снижения) - в градусах и др.

3. Выбор уровней факторов и обоснование их варьирования. При планировании эксперимента могут использоваться двухуровневые факторы

Xi,max-Xi,min (3.69)

или трехуровневые

Xi,max-Xi,0-Xi,min. (3.70)

4. Определение числа опытов и их повторов.

Минимальное число опытов активного полнофакторного эксперимента определяют по формуле

Nmin=nk, (3.71)

где n - количество уровней факторов Xi;

K - количество факторов Xi в модели.

Общее количество наблюдений N определяется по зависимости

N= m·Nmin, (3.72)

где m - количество повторений (повторов) каждого i -го опыта из Nmin.

Количество повторов m может быть для всех опытов постоянным или переменным и должно быть не менее трех (m > 3).

5. Составление матрицы планирования.

Пример построения матрицы планирования для трех факторов, имеющих два уровня варьирования, приведен в табл. 3.26.

При составлении матрицы планирования соблюдаются следующие правила расстановки знаков ("+" и "-") для i -х факторов:

- для фиктивного фактора Х0 - везде ставятся плюсы,

- для Х1 - чередуются минус и плюс;

- для Х2- чередуются два минуса и два плюса;

- для Х3- чередуются четыре минуса и четыре плюса;

- для Х4- чередуются восемь минусов и восемь плюсов;

- для взаимодействия факторов ХiХj знаки определяются путем умножения соответствующих знаков факторов Хi и Хj.

 

 

Таблица 3.26

Матрица планирования трехфакторного эксперемента

  № опыта
               
Факторы Х0 + + + + + + + +
Х1 - + - + - + - +
Х2 - - + + - - + +
Х3 - - - - + + + +
Эффекты взаимодействия Х1Х2 + - - + + - - +
Х1Х3 + - + - - + - +
Х2Х3 + + - - - - + +
Х1Х2Х3 - + + - + - - +
Повторы отклика y1i y11 y12 y13 y14 y15 y16 y17 y18
y2i y21 y22 y23 y24 y25 y26 y27 y28
y3i y31 y32 y33 y34 y35 y36 y37 y38
i y1 y2 y3 y4 y5 y6 y7 y8
S2i(y) S21 S22 S23 S24 S25 S26 S27 S28

 

Факторы Xi - для первого опыта (yi) должны иметь все минусы, а последнего (yn) - все плюсы.

6. Ввод исходных факторов Xi в матрицу планирования.

Эта задача решается по следующему правилу:

- во всех графах матрицы планирования (ХiXk), имеющих знак минус ("-"), проставляется минимальное значение фактора Xi,min;

- во всех графах матрицы, имеющих знак плюс ("+"), проставляется - Xi,max;

- в графах взаимодействия факторов ХiXj производится перемножение соответствующих значений факторов Хi и Xj. В этом случае могут умножаться Xi,min на Xi,max и т.д.

Полученные таким образом численные значения факторов в матрице планирования используются при проведении натурного или вычислительного эксперимента. Если имеется программа построения регрессионной модели, то указанные значения факторов являются вводом (исходными данными) в эту программу.

7. Проведение эксперимента.

Эксперимент проводится в соответствии с матрицей планирования (табл. 3.26) построчно, т.е. каждый i -й опыт отдельно, причем каждый опыт повторяется m раз (в табл. 3.26 - три раза). При этом получают три результата: y1i,y2i,y3i. Эта работа повторяется для каждого i-го опыта (строки матрицы планирования). Результаты опытов (повторов) записывают в соответствующие графы табл. 3.26.

8. Определение среднего значения для каждой графы табл. 3.26 по формуле

. (3.73)

Указанные значения заносятся в графу табл. 3.26.

9. Определение дисперсий S2i…S2n результатов опытов (повторов) производится по формуле

S2i (y)=, (3.74)

где m - число повторов;

yi- i-е значение отклика;

- среднее значение отклика, определяемое по формуле (3.73).

Результаты вычисленных значений S2i (по каждой графе матрицы) заносятся в табл. 3.26 (последняя строка).

10. Определение дисперсии воспроизводимости (средняя дисперсия отклика y) по формуле

, (3.75)

где значения дисперсий S2i определяются по формуле (3.74)

11. Проведение проверки однородности дисперсий S2i(S21…S2n). Эта проверка производится по критерию Кохрена

Gрас<Gтабл, (3.76)

где Gрас= - расчетное (опытное) значение критерия G,

S2max - максимальное значение S2i (выбирается из последней строки табл. 3.26),

Gтабл - табличное (теоретическое) значение критерия Кохрена. Оно определяется по таблицам математической статистики. Входами в таблицу являются: a(n)- значимость (доверительная вероятность); f1=m-1 - степень свободы; f2=N -степень свободы большая.

Если условие (3.76) не выполняется,то воспроизводимость дисперсий не соблюдается. В этом случае надо выбрать другую форму регрессионной модели. Например, вместо линейной выбрать нелинейную, степенную и др.

После выбора новой регрессионной модели все работы повторить сначала.

Критерий Кохрена применяется для случаев, когда число повторов m во всех опытах одинаково. В противном случае, когда m не равны, применяется критерий Бартлета.

Если критерий Кохрена (Бартлета) (3.76) выполняется,топроизводится определение коэффициентов регрессионной модели bi.

12. Определение коэффициентов модели bi.

Эта задача определяется по формуле

bi=. (3.77)

Здесь численные значения i берутся из столбца (строки) матрицы планирования с соответствующим знаком для каждого фактора Xi и соответствующей графы, т.е. все значения i складываются со своими знаками и потом делятся на N опытов.

Фиктивный коэффициент модели b0 определяется по формуле

. (3.78)

Коэффициенты взаимодействия факторов bij определяются со своими знаками (плюс или минус) по формуле

. (3.79)

13. Проверка значимости коэффициентов модели.

Эта проверка проводится по критерию Стьюдента. Коэффициент bi будет значим (член уравнения регрессии с этим коэффициентом остается в формуле), если соблюдается условие

tрас>tтабл, (3.80)

где tрас=- расчетное (опытное) значение критерия Стьюдента (3.81),

Sb=, S2b=; (3.82)

- определяется по формуле

(3.83)

S2i- определяются по формуле (3.74) и приведена в табл. 3.26 (последняя строка);

tтабл - табличное (теоретическое) значение критерия Стьюдента. Величина tтабл определяется по таблице.

Входом в таблицу является: a(0,05…0,2) - коэффициент значимости или соответствующая доверительная вероятность n=1-a и степень свободы f4, определяемая по формуле

f4=(m-1)N (3.84)

Проверка значимости производится для всех коэффициентов модели b0; bi; bj. Если критерий (3.80) для каких-либо коэффициентов не соблюдается,то такие слагаемые (с этими коэффициентами) из уравнения регрессии исключаются.

На основе оставшихся значимых коэффициентов составляется новая регрессионная модель.

14. Проведение проверки адекватности вновь полученной модели.

Эта проверка производится по критерию Фишера

Fрас<Fтабл, (3.85)

где Fрас=- расчетное (опытное) значение критерия.

Дисперсия адекватности S2ад определяется по формуле

S2ад=, (3.86)

где - определяют по формуле (3.73), его назначение приведено в табл. 3.26;

- значение отклика, определяемое по формуле вновь полученной модели

=b0+b1X1+b2X2+b13X1X3. (3.87)

Величины определяются для каждой графы (опыта) табл. 3.26;

K - число коэффициентов новой (3.87) регрессионной модели;

- средняя дисперсия отклика, определяется по формуле (3.75).

Табличное (теоретическое) значение критерия Фишера Fтабл определяется по таблице. Входами в таблицу являются:

1) a или n - коэффициент значимости или доверительная вероятность;

2) f3=N-(K+1) - степень свободы малая;

3) f4=N·(m-1) - степень свободы большая.

Если критерий Фишера (3.85) выполняется, то полученная модель работоспособна и может быть использована для прогнозирования соответствующих показателей.

Если критерий (3.85) не выполняется, то необходимо провести анализ составленной РМ и при необходимости составить новую.

При пассивном эксперименте исследователь не управляет экспериментом, а пассивно наблюдает за ним. Исходные данные для составления регрессионной модели в этом случае получаются путем сбора статистических характеристик из различных учетных и отчетных документов.

Недостатками пассивных экспериментов являются невозможность повторения опытов, в результате чего невозможно обоснованно проверить адекватность полученной модели, и большой объем вычислительных работ, связанный с переходом от натурных коэффициентов модели к стандартизованным и обратно. В этой связи регрессионные модели пассивного эксперимента, как правило, составляются при помощи программ, разработанных для ЭВМ.

Активный эксперимент является более предпочтительным, так как в этом случае достигается наилучшая эффективность модели при минимальном количестве опытов (N). Модели, построенные на основе активного эксперимента можно улучшать (совершенствовать) при помощи критериев Кохрена, Стьюдента и Фишера.

В случае пассивного эксперимента регрессионные модели получаются менее эффективными, без повторов наблюдений. Здесь нельзя применять критерии Кохрена, Стьюдента, а, следовательно, и совершенствовать регрессионные модели

 

 

<== предыдущая лекция | следующая лекция ==>
Общая характеристика статистических моделей | Система X Window
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 727; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.039 сек.