Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

При количестве наблюдений в каждой выборке не менее 61 возможно принятие гипотезы Н1 о значимом различии показателей




Например, при получении незначимого различия показателя в независимых выборках

1. =10, S1 = 5, n 1=25;

2. = 12, S2 = 6, n 2 = 25,

для получения значимого различия с р< 0.05 (при f = n 1+ n 2 -2 = 48 - t05 ~ 2.00; получено из Таблицы значений критерия Стьюдента) следует иметь число наблюдений

n 1 и n 2 = 6 1 наблюдение.

 


Планирование эксперимента. Модули Дисперсионного, канонического
и кластерного анализа в программе СТАТИСТИКА

Планирование эксперимента

Планирование эксперимента (активный эксперимент) в фармации - раздел математической статистики, изучающий методы организации совокупности опытов с различными условиями для получения наиболее достоверной информации о свойствах исследуемого объекта при наличии неконтролируемых случайных возмущений. Величины, определяющие условия данного опыта, обычно называются факторами (например, температура, концентрация), их совокупность - факторным пространством. Набор значений факторов характеризует некоторую точку факторного пространства, а совокупность всех опытов составляет так называемый факторный эксперимент. Расположение точек в факторном пространстве определяет план эксперимента, который задает число и условия проведения опытов с регистрацией их результатов.

Начало планированию экспериментов положили труды P. Фишера (1935). Он показал, что рациональное планирование экспериментов дает не менее существенный выигрыш в точности оценок, чем оптимизированная обработка результатов измерений.

Планирование экспериментов используют для изучения и математического описания процессов и явлений путем построения мат. моделей в форме уравнений регрессии - соотношений, связывающих с помощью ряда параметров значения факторов и результаты эксперимента, называемых откликами. Основное требование, предъявляемое к планам факторного эксперимента, в отличие от пассивного эксперимента, - минимизация числа опытов, при которой получают достоверные оценки вычисляемых параметров при соблюдении приемлемой точности мат. моделей в заданной области факторного пространства. В этом случае задача обработки результатов факторного эксперимента заключается в определении численных значений указанных параметров.

Одним из способов повышения точности обработки результатов планирования эксперимента служит замена переменных, при которой от исходных (физических, или натуральных) значений переменных, выраженных в соответствующих единицах измерений, переходят к безразмерным значениям, определяемым формулой:

где m-число факторов;

x j- безразмерное значение переменной;

zj - значение физической переменной;

- среднее значение физической переменной,

- интервал ее варьирования;

и -максимальные и минимальные значения физической переменной, которые могут быть заданы в опытах. При таком преобразовании значения всех хj или уровни факторов, изменяются в одинаковых пределах: от -1 до +1. Точка факторного пространства, отвечающая нулевым значениям факторов, называется центром плана.

Область применения планирования экспериментов распространяется на процессы и явления, зависящие от так называемых управляемых факторов, т. е. факторов, которые можно изменять и поддерживать на заданных уровнях.

Основные направления использования планирования экспериментов в фарм. технологии:

1) выделение значимых факторов, существенно влияющих на изучаемый процесс;

2) получение математических моделей объектов исследования (аппроксимационные задачи);

3) поиск оптимальных условий протекания процессов, т. е. совокупности значений факторов, при которой заданный критерий оценки эффективности процесса имеет наилучшее значение (экстремальные задачи);

4) построение диаграмм состав-свойство;

5) изучение кинетики и механизма процессов.

Выделение значимых факторов осуществляется в ходе отсеивающего эксперимента. Число опытов в нем может быть больше, равно или меньше числа проверяемых факторов. Планы, отвечающие таким экспериментам, называются соответственно ненасыщенными, насыщенными или сверхнасыщенными.

Ненасыщенные планы используют, если предварительно исследованию подлежат сравнительно небольшое число факторов (n < 6 - 7) и их возможные взаимодействия. Эффект взаимодействия двух или нескольких факторов проявляется при одновременном их варьировании, когда влияние каждого фактора на отклик зависит от уровней, на которых находятся другие факторы. Ненасыщенные планы обычно включают значительное число опытов и поэтому достаточно трудоемки. В качестве таких планов часто применяют планы так называемого полного факторного эксперимента (ПФЭ), в котором каждый фактор изменяется одинаковое число раз q (где q 2 - число выбранных уровней); при этом реализуются все возможные опыты, различающиеся значением хотя бы одного фактора. Число опытов в ПФЭ

n = qm:

например, для m = 2 и q = 2 число n = 22 = 4 опыта.

 

Условия проведения опытов могут быть представлены в графической (см. рис. на стр. 50) или табличной (см. табл.4) форме. В последнем случае первый столбец (i-номер опыта) и совокупность значений факторов (второй и третий столбцы) образуют матрицу плана ПФЭ, к которой предъявляют такие требования:

2) сумма элементов столбца каждого фактора равна нулю:

(u-текущий номер опыта);

2) сумма квадратов элементов столбца каждого фактора равна числу опытов:

3) сумма почленных произведений любых столбцов двух любых факторов равна нулю:

Представление условий проведения опытов в табличной форме.

 

 

Таблица 4. Представление условий проведения опытов в табличной форме.

i Кодированные переменные Отклик y
x1 x2
  -1 + 1 y1
  - 1 - 1 y2
  + 1 + 1 y3
  + 1 -1 y4

 

Значения физических переменных, соответствующие матрице, выбранной для реализации опытов, рассчитывают по формуле:

При числе опытов в ПФЭ, значительно превышающем число определяемых параметров модели, применяют так называемые дробные реплики (или дробный факторный эксперимент -ДФЭ), которые представляют собой часть плана ПФЭ. ДФЭ может содержать половину, четверть и т.д. опытов от ПФЭ. Соответственно различают полуреплики (qm-1), четвертьреплики (qm-2) и т. п. В общем случае ДФЭ может быть обозначен как qm-l, где l-дробность реплики. К матрице ДФЭ предъявляют те же требования, что и к матрице ПФЭ. Планы, полученные с использованием ПФЭ или его дробных реплик, в которых переменные варьируются на двух уровнях, называются линейными либо планами 1-го порядка, т.к. при их применении можно построить уравнение модели, включающее исследуемые факторы лишь в 1-й степени.

 

 

 

Насыщенные планы используют, если математическая модель предполагается в виде полинома (уравнения регрессии) 1-го порядка, общий вид которого может быть представлен выражением:

 

где y-отклик, b0 и bj-параметры модели. В качестве насыщенных планов наиболее часто применяют планы ДФЭ.

Алгоритм выделения значимых факторов в этом случае включает следующие этапы:

3) по формуле определяют параметры математической модели.

4) По результатам параллельных опытов вычисляют дисперсию воспроизводимости, характеризующую разброс значений отклика. Например, при проведении r параллельных опытов в одной точке факторного пространства:

где

3)По формуле определяют дисперсию каждого параметра.

4) Для оценки точности найденных значений параметров, а также полученной мат. модели используют статистические критерии соответствия Стьюдента (t-критерий) и Фишера (F-критерий). При этом количественными мерами служат доверительная вероятность или уровень значимости p = 1 — и число степеней свободы f, т. е. число экспериментов за вычетом числа констант, рассчитываемых по результатам этих опытов. Число констант определяется видом выбранной дисперсии; например, в случае дисперсии воспроизводимости по результатам параллельных опытов находят величину , поэтому fb = r — 1. При заданных требованиях на точность результатов измерений доверительная вероятность (уровень значимости) определяет надежность полученной оценки. Значения указанных критериев табулированы и приводятся в специальной литературе.

5) Значимость каждого фактора проверяют оценкой значимости соответствующего параметра, т.к. вклады факторов в значение отклика пропорциональны значениям параметров. Для оценки их значимости рассчитывают соответствующее значение t-критерия по формуле:

Полученное значение сравнивают с табличным tT, найденным на предыдущем этапе. При выбранной доверительной вероятности параметр считается значимым, если tbi. > tT. В противном случае параметр незначим и соответствующий фактор можно исключить из построенной математической модели.

Сверхнасыщенные планы используют, если на процесс может влиять большое число факторов и их взаимодействий. Наиболее часто с целью уменьшения их числа применяют метод случайного баланса, позволяющий вместо ПФЭ и ДФЭ применять эксперименты, в которых значения факторов распределены по уровням случайным образом (рандомизированы). Метод имеет высокую разрешающую способность (возможность выделять сильно влияющие факторы), но малую чувствительность (т. е. способность выделять значимые параметры модели, характеризующие факторы, которые имеют относительно слабое влияние). Используют также метод последовательного отсеивания: все изучаемые факторы на основе априорной информации подразделяют на группы, каждую из которых в дальнейшем рассматривают как отдельный комплексный фактор. В зависимости от полученной при этом информации остальные факторы снова разбивают на группы и выполняют новый цикл расчетов.

Аппроксимационные задачи. Для учета нелинейностей объекта исследований его математическое описание часто получают в виде полинома i-го порядка, который в общем виде выражается формулой:

y = bi xi + bi-1 xi-1 + ….+ b0

Например, полином 2-го порядка для двух факторов записывается следующим образом:

Для нахождения параметров таких моделей недостаточно варьирования значений факторов на двух уровнях, поскольку нелинейность не может быть определена двумя точками. Поэтому для указанных моделей обычно применяют так называемые композиционные планы, включающие изменения факторов более чем на двух уровнях, что позволяет использовать их для построения моделей порядка выше первого. Общий алгоритм решения аппроксимационной задачи включает этапы.

1) Выбирают число существенных факторов, их средние значения и интервалы варьирования - эта информация может быть получена после проведения отсеивающего эксперимента или на основании знаний и интуиции исследователя.

2) Строят матрицу плана; на начальном этапе исследования в зависимости от числа факторов выбирают, как правило, планы 1-го порядка (ПФЭ или ДФЭ).

3) Рандомизируют опыты - для уменьшения влияния систематических ошибок опыты проводят в условиях, соответствующих строкам матрицы плана, выбираемым в случайном порядке (целесообразность такого приема подтверждена на практике).

4) Обрабатывают полученные результаты - рассчитывают параметры и составляют уравнение регрессии, оценивают значимость параметров и проверяют адекватность полученной мат. модели имеющимся экспериментальным данным. Для проверки адекватности модели анализируют разность между опытными значениями и значениями отклика, предсказанными по полученной мат. модели в разных точках факторного пространства. В качестве последних могут быть взяты как точки плана (при ненасыщенных планах), так и дополнительные точки. Их обычно выбирают в области, представляющей наибольший интерес, либо располагают таким образом, чтобы полученные результаты можно было использовать для построения более точной модели высокого порядка.

5) Принимают решение о дальнейших действиях: если на этапе 4 получено адекватное уравнение регрессии, вывод аппроксимационной зависимости на этом заканчивают; в противном случае выясняют причину неадекватности и проводят новую серию экспериментов с использованием планов 1-го порядка (уменьшают интервалы варьирования факторов, включают в мат. модель новый фактор и т.д.) или более высоких порядков (выбор определяется целями исследователя).

В результате проверки адекватности модель может оказаться неадекватной вследствие того, что:

а) в нее включены не все факторы, существенно влияющие на процесс. В этом случае выбирают более полную модель и для определения ее параметров строят, реализуют и обрабатывают новую матрицу планирования;

б) не учтены эффекты взаимодействия разных факторов. Для их учета предполагаемые взаимодействия включают в модель и, если позволяет исходный план (число опытов не менее числа определяемых параметров новой модели), повторно обрабатывают результаты эксперимента. Если начальный план не дает возможности провести такую обработку (n < т), выполняют дополнительные опыты с расширенным планом (например, от полуреплики переходят к ПФЭ и т.п.), причем реализуются только те опыты, которые не входили в исходный план;

в) принятый порядок модели ниже требуемого. Для проверки необходимо расширить используемый композиционный план, включив опыты, обеспечивающие получение модели более высокого порядка. Если модель высшего порядка будет адекватной, то это предположение подтверждается.

При проведении эксперимента исследователь может предъявлять к мат. модели различные требования: получение определенных оценок ее параметров; обеспечение желаемых предсказательных свойств и т. п. Это приводит к необходимости выбора специальных планов, подчиненных поставленным требованиям (критериям). Среди критериев, удовлетворяющих первому требованию, наиболее общим является D-критерий, соответствующий обобщенной дисперсии всех оценок параметров математической модели. Кроме него применяют А-критерий, отвечающий средней дисперсии оценок параметров; Е-критерий, соответствующий длине максимальной оси эллипсоида рассеяния оценок параметров; критерий ортогональности, обеспечивающий независимость определения параметров модели, и т.д. Среди критериев, удовлетворяющих второму требованию, особенно часто используют G-критерий, отвечающий макс. дисперсии предсказанных значений функции отклика; Q-критерий, соответствующий среднему значению дисперсий предсказанных значений; критерий ротатабельности, отвечающий дисперсии оценки предсказанных значений отклика во всех точках, равноудаленных от центра плана, и др.

Планы, минимизирующие приведенные выше критерии, называют соотв. D-оптимальными, A-оптимальными и т.д. Как правило, не удается построить план, одновременно удовлетворяющий нескольким критериям. Исключение составляют линейные планы: например, планы ПФЭ и ДФЭ не только ортогональны и ротатабельны, но еще и D-, G-, А- и E-оптимальны. Поэтому, если цель исследования - построение некоторой описательной математической модели, аппроксимирующей опытные данные, рекомендуют использовать планы, отвечающие D-критерию; если модель должна обладать наилучшими предсказательными свойствами, используют планы, соответствующие G- или Q-критерию. Если, наконец, цель эксперимента - поиск оптимальных условий функционирования объекта, часто применяют ротатабельные планы.

Экстремальные задачи имеют целью определить наилучшее значение целевой функции, в качестве которой принимают значение интересующей исследователя характеристики процесса. Такие задачи могут быть решены по крайней мере двумя способами: с построением и без построения математической модели.

Планирование экспериментов с построением математической модели процесса. На основе выбранного плана строят модель, отвечающую рассматриваемому отклику, и, используя ее, с помощью известных методов поиска экстремума находят значения факторов, при которых целевая функция, определенная по модели, будет экстремальной. Если найденные значения факторов, соответствующие экстремальной точке, лежат на границе примененного плана, область планирования либо смещается, либо расширяется и строится новая модель, после чего поиск экстремума повторяется. Задача считается решенной, если вычисленные координаты точки экстремума находятся внутри области, характеризуемой использованным планом.

На практике такой подход часто реализуют методом «крутого восхождения» (метод Бокса-Уилсона). Выбирают начальную точку, в окрестности которой проводят ПФЭ или ДФЭ (в зависимости от числа факторов); по его результатам рассчитывают параметры математической модели 1-го порядка. Если модель адекватна, с ее помощью определяют направление изменения факторов, соответствующее движению к экстремальному значению целевой функции в направлении градиента или антиградиента (соответственно при поиске максимума или минимума). Движение в выбранном направлении осуществляют с помощью последовательно выполняемых опытов и производят до тех пор, пока отклик изменяется желаемым образом. В найденной наилучшей (для выбранного направления) точке снова выполняют ПФЭ или ДФЭ и т.д. Изложенную процедуру повторяют до построения адекватной модели на каждом этапе. Неадекватность модели, полученной на очередном этапе, свидетельствует о том, что, возможно, достигнута область экстремума, в которой линейную модель уже нельзя использовать. Для уточнения положения экстремума в этой области можно применять модель 2-го порядка, построенную посредством соответствующих планов.

Непосредственно эксперимент на объекте (без построения модели). Стратегия проведения опытов определяется выбранным методом оптимизации. При этом значение целевой функции вычисляют не по модели, а находят непосредственно из опыта, выполненного в соответствующих условиях. Наиболее часто для поиска наилучшего значения целевой функции используют последовательный симплексный метод, метод Гаусса-Зейделя и т.п.

Построение диаграмм состав-свойство. Построение таких диаграмм - важная часть физико-химических исследований различных смесей. Для смесей, содержащих k компонентов, характерно наличие следующего ограничения:

Сумма концентраций компонентов смеси обычно нормируется, поэтому соотношение имеет вид:

где xi-относительная концентрация i-го компонента смеси. При обработке результатов активного эксперимента это выражение определяет в n-мерном пространстве переменных xi область их допустимых изменений, называемую симплексом. Например, в случае трех переменных симплекс представляет собой равносторонний треугольник (рис. 2). Вершинам симплекса соответствуют чистые компоненты. Точки на границах симплекса (ребрах) отвечают бинарным смесям соответствующих пар компонентов. Любая точка внутри симплекса отвечает составу смеси, в которой присутствуют все три компонента (указанные точки отмечены на рис. штриховкой). Для четырехкомпонентной смеси симплексом служит тетраэдр, грани которого- симплексы, соответствующие трехкомпонентным смесям, и т.д.

Согласно условию , упомянутые выше факторные эксперименты непригодны для построения диаграмм состав-свойство из-за невозможности независимого варьирования каждого фактора. На практике для построения таких моделей иногда применяют симплекс-решетчатые планы (планы Шеффе), представляющие собой набор точек, равномерно распределенных на границе и внутри симплекса. Эти планы обычно насыщены и могут быть композиционными; например, точки плана 1-го порядка входят во все послед. композиции. Предложены также насыщенные симплекс - центроидные планы, которые состоят из точек, расположенных в вершинах симплекса, серединах ребер, центрах граней различной размерности и в центре симплекса.

Адекватность моделей, построенных на основе симплекс - решетчатых и симплекс -центроидных планов, вследствие их насыщенности проверяют по результатам дополнительных опытов в контрольных точках. Их координаты целесообразно выбирать так, чтобы они могли быть использованы, если возникнет необходимость получения уточненной модели более высокого порядка.

Изучение объектов, характеризуемых наличием неоднородностей. В общем случае источники неоднородностей могут быть непрерывного или дискретного типа. Источники непрерывного типа характеризуются изменением свойств объекта (его дрейфом) во времени или по какой-либо другой переменной (например, неравномерное старение катализатора по длине аппарата). В случае невысоких (по сравнению с продолжительностью проведения всех опытов эксперимента) скоростей дрейфа можно использовать обычные методы планирования экспериментов. При высоких скоростях дрейфа применяют специальные планы, построенные, например, на основе «ортогональных полиномов Чебышева» и т. п.

 

Рис. 7. Симплекс, латинский квадрат

Источники дискретного типа: различие в сырье, технологических аппаратах, способах проведения процессов, исполнителях и т. д. В данном случае задача планирования экспериментов заключается в сокращении числа оцениваемых возможных сочетаний изучаемых факторов, т.е. относится к классу комбинаторных задач. Их решают с помощью планов, основанных на специальных правилах размещения факторов по уровням в каждом опыте. Существует множество способов организации таких планов, из которых наиболее распространены планы, использующие свойства «латинских» и «греко-латинских квадратов», кубов и др. Например, латинский квадрат представляет собой таблицу, состоящую из n строк и n столбцов и заполненную n элементами (числами или буквами) так, что каждый элемент повторяется в каждой строке и каждом столбце только один раз.

Изучение кинетики и механизмов процессов связано, как правило, с разработкой детерминированных моделей, отражающих физико-химическую сущность исследуемых явлений и содержащих описания механизмов (кинетики) протекающих в них элементарных процессов. Среди задач, решаемых методами планирования экспериментов, можно выделить:

1) определение (уточнение) параметров моделей;

2) дискриминацию, т.е. отбрасывание проверяемых механизмов элементарных процессов.

Для уточнения параметров детерминированных моделей необходимо выбрать такой план эксперимента, который обеспечит наилучшие оценки определяемых величин. Наиболее часто для этих целей используют, как указано выше, D-оптимальные планы. При уточнении параметров планирования экспериментов сталкиваются с рядом трудностей. К основным из них можно отнести:

1) необходимость иметь отдельный план для каждого класса моделей, т. е. в каждой конкретной ситуации исследователь должен вычислить оптимальное расположение точек в факторном пространстве для постановки уточняющих экспериментов;

2) необходимость расчета параметров детерминированных моделей с использованием методов оптимизации; это обусловлено обычно нелинейностью данных моделей относительно определяемых параметров.

Задача дискриминации заключается в выборе такой модели среди нескольких конкурирующих, которая наиболее правильно отражает механизм процесса и обладает наилучшей предсказательной способностью. Эта задача реализуется сопоставлением результатов оценки соответствия модели опытным данным при использовании различных описаний одного и того же процесса или явления. Самый простой метод дискриминации состоит в вычислении параметров каждой предложенной модели по экспериментальным данным и последующем сравнении остаточных дисперсий. В качестве выбранной модели принимают модель с минимальной остаточной дисперсией. Если не удается выбрать механизм, не противоречащий опытным данным, то либо расширяют исследуемую область, либо смещают расположение точек в факторном пространстве и операцию повторяют. Достоинство такого подхода заключается в том, что исследователь одновременно решает обе задачи - вычисление параметров и дискриминацию моделей. К недостаткам можно отнести то, что при этом часто требуются большие затраты времени на эксперименты и расчет параметров моделей.

Данные, полученные в ходе нашего эксперимента, необходимо обработать. Как мы видели, они подчиняются нормальному закону распределения, и, следовательно, к ним можно применить определенные виды статистического анализа.

Основными элементами математических моделей являются признаки, которыми описываются объекты наблюдения. Их подразделяют на факторы-причины, воздействующие на объекты, и показатели – отклики, характеризующие состояние изучаемой системы. Вероятность прогнозируемого значения показателя-отклика – степень возможности проявления какого – либо определённого события в тех или иных условиях.

В тех случаях, когда факторы-причины и показатели-отклики измерялись в количественных шкалах и между ними установлена сильная и значимая корреляционная связь, моделирование выполняется методами РЕГРЕССИОННО - КОРРЕЛЯЦИОННОГО АНАЛИЗА. Регрессионный анализ (линейный) — статистический метод исследования зависимости между зависимой переменной Y и одной или несколькими независимыми переменными X1,X2,...,Xp. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными. Целью регрессионного анализа является определение наличия и характера (математического уравнения, описывающего зависимость) связи между переменными, определение степени детерминированности вариации критериальной переменной предикторами, предсказание значения зависимой переменной с помощью независимой и определение вклада независимых переменных в вариацию зависимой (модули Множественная регрессия / Multiply Regression, Непараметрические данные/ Nonparametrics в программе СТАТИСТИКА).

Когда в исследовании имеются факторы только неколичественного характера (порядковые или номинальные) и они задаются в эксперименте на некоторых качественных уровнях, то для моделирования значений показателей-откликов на воздействия таких факторов и решения задач исследования применяется ДИСПЕРСИОННЫЙ АНАЛИЗ. Он выявляет структуру связи между показателем-откликом и факторами-причинами, позволяет оценить степень влияния каждого из изучаемых качественных факторов, а также их взаимодействий на дисперсию показателя-отклика (модуль Анализ вариантов /ANOVA).

Иногда результаты эксперимента включают как количественные, так и качественные факторы, воздействующие на объекты наблюдения. В этих условиях для моделирования показателя-отклика не только в зависимости от основных качественных факторов, но и с учетом влияния сопутствующих количественных эффективен КОВАРИАЦИОННЫЙ АНАЛИЗ (модуль Дополнительные линейные/нелинейные модели/Структурное моделирование уравнения / Advanced Linear/Nonlinear Models/Structural Equation Modeling).

Для решения задач классификации (распознавания образов) и отнесения объекта с определенным набором признаков к одному из известных классов используется ДИСКРИМИНАНТНЫЙ АНАЛИЗ. В медицине такой вид анализа применяется для решения диагностических, прогностических, экспертных задач, выбора методов и схем лечения. Для классификации определяется линейная комбинация (линейная дискриминантная функция), которая максимизирует различия между классами, но минимизирует дисперсию внутри классов. В итоге определяются линейные классификационные функции для каждого класса (модуль Многомерные исследовательские методы/Дискриминантный анализ / Multivariate Exploratory techniques/Discriminant Analysis).

Результаты исследования, в котором все переменные являются только качественными, традиционно сводятся в таблицы сопряженности. Моделировать по таким таблицам лучше всего посредством процедур ЛОГЛИНЕЙНОГО АНАЛИЗА. Такой анализ обеспечивает установление силы и значимости связей между признаками с учетом их взаимодействия, определение степени влияния исходных факторов на выходные результирующие признаки-отклики, прогнозирование ожидаемых частот наблюдений при определенных сочетаниях уровней факторов (модуль Основная статистика/Таблицы/Блок таблиц / Basic Statistics/Tables)

Анализ результатов эксперимента, содержащих качественные факторы и количественный признак-отклик, оценивающий продолжительность жизни (продолжительность ремиссии хронического заболевания, многолетней выживаемости онкологических больных после оперативного лечения и т.д.) и построение модели функции продолжительности жизни проводится методом АНАЛИЗА ВРЕМЕНИ ВЫЖИВАНИЯ. (модули Дополнительные линейные/нелинейные модели/Анализ выживания /Advanced Linear/Nonlinear Models/Survival Analysis и Дополнительные линейные/нелинейные модели/Прогноз-Серия времени /Advanced Linear/Nonlinear Models/Time Series Forecasting).

В последнее время в иностранной и отечественной литературе упоминается метод моделирования с помощью логистической регрессии. Показаниями к применению этого метода являются:

признак-отклик является дихотомическим (измеряется на двух уровнях и является альтернативным);




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 874; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.067 сек.