Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Обработка и анализ результатов моделирования систем

 

После того как машинный эксперимент спланирован, необходимо предусмотреть меры по организации эффективной обработки и представления его результатов. Вообще, проблема статистической обработки результатов эксперимента с моделью выделяется в самостоятельную проблему. При этом надо иметь в виду, что применяемые на практике методы обработки результатов моделирования составляют только небольшую часть арсенала математической статистики [2-5]

При выборе методов обработки существенную роль играют три особенности машинного эксперимента с моделью системы.

1. Возможность получать при моделировании системы на компьютере большие выборки позволяет количественно оценить характеристики процесса функционирования системы, но превращает в серьезную проблему хранение промежуточных результатов моделирования. Эту проблему можно решить, используя рекуррентные алгоритмы обработки, когда оценки вычисляют по ходу моделирования, причем большой объем выборки дает возможность пользоваться при этом достаточно простыми для расчетов на компьютере асимптотическими формулами.

2. Сложность исследуемой системы при ее моделировании на компьютере часто приводит к тому, что априорное суждение о характеристиках процесса функционирования системы, например о типе ожидаемого распределения выходных переменных, является невозможным. Поэтому при моделировании систем широко используются непараметрические оценки и оценки моментов распределения.

3. Блочность конструкции машинной модели и раздельное исследование блоков связаны с программной имитацией входных переменных для одной частичной модели по оценкам выходных переменных, полученных на другой частичной модели. Если компьютер, используемый для моделирования, не позволяет воспользоваться переменными, записанными на внешние носители, то следует представить эти переменные в форме, удобной для построения алгоритма их имитации.

 

4.1. Методы обработки результатов измерений

 

Рассмотрим наиболее удобные для программной реализации методы оценки распределений и некоторых их моментов при достаточно большом объеме выборки (числе реализаций). Математическое ожидание и дисперсия случайной величины, соответственно имеют вид:

 

где - плотность распределения случайной величины, принимающей значения.

При проведении имитационного эксперимента со стохастической моделью системы определить эти моменты нельзя, так как плотность распределения, как правило, априори неизвестна. Поэтому при обработке результатов моделирования приходится довольствоваться лишь некоторыми оценками моментов, полученными на конечном числе реализаций. При независимых наблюдениях значений случайной величины в качестве таких оценок используются:

 

 

где и - выборочное среднее и выборочная дисперсия соответственно. Знак ~ над и означает, что эти выборочные моменты используются в качестве оценок математического ожидания и дисперсии.

К качеству оценок, полученных в результате статистической обработки результатов моделирования, предъявляются следующие требования [2-4]:

1) несмещенность оценки, т е равенство математического ожидания оценки определяемому параметру:

,

где — оценка переменной (параметра);

2) эффективность оценки, т е. минимальность среднего квадрата ошибки данной оценки:

,

где - рассматриваемая оценка; - любая другая оценка;

3) состоятельность оценки, т. е. сходимость по вероятности при к оцениваемому параметру:

,.

Рассмотрим оценку выборочного среднего значения. Математическое ожидание выборочного среднего значения составит:

,

т. е. оценка является несмещенной.

С учетом независимости значений средний квадрат ошибки:

,

т. е. оценка состоятельна.

В [3] показано, что эта оценка также и эффективна.

При моделировании сложных систем, к которым относятся сети и системы телекоммуникаций, при большом числе реализаций в результате моделирования получается значительный объем информации о состояниях процесса функционирования системы. Поэтому необходимо так организовать в процессе вычислений фиксацию и обработку результатов моделирования, чтобы оценки для искомых характеристик формировались постепенно по ходу моделирования, т. е. без специального запоминания всей информации о состояниях процесса функционирования системы.

Если при моделировании процесса функционирования конкретной системы учитываются случайные факторы, то и среди результатов моделирования присутствуют случайные величины. В качестве оценок для искомых характеристик рассчитывают средние значения, дисперсии, корреляционные моменты и т. д.

Пусть в качестве искомой величины фигурирует вероятность некоторого события. В качестве оценки для искомой вероятности используется частость наступления события, где - число случаев наступления события; - число реализаций. Такая оценка вероятности появления события является состоятельной, несмещенной и эффективной. В случае необходимости получения оценки вероятности в памяти компьютера при обработке результатов моделирования достаточно накапливать лишь число (при условии, что задано заранее).

Аналогично при обработке результатов моделирования можно подойти к оценке вероятностей возможных значений случайной величины, т. е. закона распределения. Область возможных значений случайной величины разбивается на интервалов. Затем накапливается количество попаданий случайной величины в эти интервалы,. Оценкой для вероятности попадания случайной величины в интервал с номером к служит величина. Таким образом, при этом достаточно фиксировать значений при обработке результатов моделирования на компьютере.

Для оценки среднего значения случайной величины накапливается сумма возможных значений случайной величины,, которые она принимает при различных реализациях. Тогда среднее значение:

. (4.1)

При этом ввиду несмещенности и состоятельности оценки:

,.

В качестве оценки дисперсии случайной величины при обработке результатов моделирования можно использовать:

. (4.2)

Непосредственное вычисление дисперсии по этой формуле нерационально, так как среднее значение изменяется в процессе накопления значений. Это приводит к необходимости запоминания всех значений. Поэтому более рационально организовать фиксацию результатов моделирования для оценки дисперсии с использованием следующей формулы:

. (4.3)

Тогда для вычисления дисперсия достаточно накапливать две суммы: значений и их квадратов.Для случайных величин и с возможными значениями и корреляционный момент:

, или

.

Последнее выражение вычисляется при запоминании в процессе моделирования небольшого числа значений.

Если при моделировании системы искомыми характеристиками являются математическое ожидание и корреляционная функция случайного процесса, то для нахождения оценок этих величин указанный интервал разбивают на отрезки с постоянным шагом и накапливают значения процесса для фиксированных моментов времени.

При обработке результатов моделирования математическое ожидание и корреляционную функцию запишем так:

(4.4)

где и пробегают все значения.

Для уменьшения затрат машинных ресурсов на хранение промежуточных результатов последнее выражение также целесообразно привести к следующему виду:

. (4.5)

Отметим особенности фиксации и обработки результатов моделирования, связанные с оценкой характеристик стационарных случайных процессов, обладающих эргодическим свойством.

Пусть рассматривается процесс. Тогда с учетом этих предположений поступают в соответствии с правилом: среднее по времени равно среднему по множеству. Это означает, что для оценки искомых характеристик выбирается одна достаточно продолжительная реализация процесса, для которой целесообразно фиксировать результаты моделирования. Для рассматриваемого случая запишем математическое ожидание и корреляционную функцию процесса:

.

На практике при моделировании системы интервал оказывается ограниченным и, кроме того, значения удается определить только для конечного набора моментов времени. При обработке результатов моделирования для получения оценок и используем приближенные формулы:

. (4.6)

которые целесообразно преобразовать к виду, позволяющему эффективно организовать порядок фиксации и обработки результатов моделирования [3].

При обработке результатов машинного эксперимента с моделью наиболее часто возникают следующие задачи:

- определение эмпирического закона распределения случайной величины;

- проверка однородности распределений;

сравнение средних значений и дисперсий переменных, полученных в результате моделирования, и т. д.

Эти задачи с точки зрения математической статистики являются типовыми задачами по проверке статистических гипотез.

Задача определения эмпирического закона распределения случайной величины наиболее общая из перечисленных, но для правильного решения требует большого числа реализаций. В этом случае по результатам машинного эксперимента находят значения выборочного закона распределения (или функции плотности) и выдвигают нулевую гипотезу, что полученное эмпирическое распределение согласуется с каким-либо теоретическим распределением. Проверяют эту гипотезу с помощью статистических критериев согласия Колмогорова, Пирсона, Смирнова и т. д., причем необходимую в этом случае статистическую обработку результатов ведут по возможности в процессе моделирования системы.

Для принятия или опровержения гипотезы выбирают некоторую случайную величину, характеризующую степень расхождения теоретического и эмпирического распределения, связанную с недостаточностью статистического материала и другими случайными причинами. Закон распределения этой случайной величины зависит от закона распределения случайной величины и числа реализаций при статистическом моделировании системы. Если вероятность расхождения теоретического и эмпирического распределений велика в понятиях применяемого критерия согласия, то проверяемая гипотеза о виде распределения не опровергается. Выбор вида теоретического распределения (или) проводится по полученным графикам (гистограммам) (или).

 

4.2. Корреляционный, регрессионный и дисперсионный анализ результатов моделирования

 

Возможность фиксации при моделировании системы на компьютере значений переменных (параметров) и их статистическая обработка для получения интересующих экспериментатора характеристик позволяют провести объективный анализ связей между этими величинами. Для решения этой задачи существуют различные методы, зависящие от целей исследования и вида получаемых при моделировании характеристик. Рассмотрим особенности использования методов корреляционного, регрессионного и дисперсионного анализа для результатов моделирования систем [2-4].

Корреляционный анализ результатов моделирования. С помощью корреляционного анализа исследователь может установить, насколько тесна связь между двумя (или более) случайными величинами, наблюдаемыми и фиксируемыми при моделировании конкретной системы. Корреляционный анализ результатов моделирования сводится к оценке разброса значений относительно среднего значения, т. е. к оценке силы корреляционной связи. Существование этих связей и их тесноту можно для схемы корреляционного анализа выразить при наличии линейной связи между исследуемыми величинами и нормальности их совместного распределения с помощью коэффициента корреляции:

, (4.7)

т.е. второй смешанный центральный момент делиться на произведение средних квадратичных отклонений, чтобы иметь безразмерную величину, инвариантную относительно единиц измерения рассматриваемых переменных.

На рис. 4.1 приведены примеры различных случаев корреляции переменных.

Для того чтобы оценить точность полученной при обработке результатов моделирования системы оценки, целесообразно ввести в рассмотрение коэффициент, причем приближенно подчиняется гауссовскому распределению со средним значением и дисперсией:

. (4.8)

 

 

Рис. 4.1. Различные случаи корреляции переменных

 

Из-за влияния числа реализаций при моделировании на оценку коэффициента корреляции необходимо убедиться в том, что действительно отражает наличие статистически значимой корреляционной зависимости между исследуемыми переменными модели. Это можно сделать проверкой гипотезы:. Если гипотеза при анализе отвергается, то корреляционную зависимость признают статистически значимой. Очевидно, что выборочное распределение введенного в рассмотрение коэффициента при является гауссовским с нулевым средним и дисперсией. Следовательно, область принятия гипотезы определяется неравенством:

, (4.9)

где подчиняется нормированному гауссовскому распределению. Если лежит вне приведенного интервала, то это означает наличие корреляционной зависимости между переменными модели на уровне значимости.

При анализе результатов моделирования системы важно отметить то обстоятельство, что даже если удалось установить тесную зависимость между двумя переменными, то отсюда еще непосредственно не следует их причинно-следственная взаимообусловленность. Возможна ситуация, когда случайные, и стохастически зависимы, хотя причинно они являются для системы независимыми. При статистическом моделировании наличие такой зависимости может иметь место, например, из-за коррелированности последовательностей псевдослучайных чисел, используемых для имитации событий, положенных в основу вычисления значений и.

Таким образом, корреляционный анализ устанавливает связь между исследуемыми случайными переменными машинной модели и оценивает тесноту этой связи. Однако в дополнение к этому желательно располагать моделью зависимости, полученной после обработки результатов моделирования.

Регрессионный анализ результатов моделирования. Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе машинного эксперимента с системой. Под наилучшим соответствием понимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента. Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок.

Рассмотрим пример регрессионного анализа результатов моделирования при построении линейной регрессионной модели. На рис. 4.2 показаны точки полученные в машинном эксперименте с моделью системы. Делаем предположение, что модель результатов машинного эксперимента графически может быть представлена в виде прямой:

,

где величина, предсказываемая регрессионной моделью.

 

 

 

Рис. 4.2. Построение линейной регрессионной модели

 

Требуется получить такие значения коэффициентов и, при которых сумма квадратов ошибок модели является минимальной. На рисунке ошибка,, для каждой экспериментальной точки определяется как расстояние по вертикали от этой точки до линии регрессии.

Обозначим,. Тогда выражение для ошибок будет иметь вид:

,

а функция ошибки:

.

Для получения и, при которых функция является минимальной, применяются обычные методы математического анализа. Условием минимума является,.

Дифференцируя, получаем:

.

Решая систему этих двух линейных алгебраических уравнений, можно получить значения и. В матричном представлении эти уравнения имеют вид:

.

Решая это уравнение, получаем:

 

где N - число реализаций при моделировании системы.

Соотношения для вычисления и требуют минимального объема памяти компьютера для обработки результатов моделирования. Обычно мерой ошибки регрессионной модели служит среднее квадратичное отклонение:

 

Для нормально распределенных процессов приблизительно 67% точек находится в пределах одного отклонения от линии регрессии и 95% - в пределах 2. Для проверки точности оценок и регрессионной модели могут быть использованы, например, критерии Фишера и Стьюдента. Аналогично могут быть оценены коэффициенты уравнения регрессии и для случая нелинейной аппроксимации.

Дисперсионный анализ результатов моделирования. При обработке и анализе результатов моделирования часто возникает задача сравнения средних выборок. Если в результате такой проверки окажется, что математическое ожидание совокупностей случайных переменных,, …, отличается незначительно, то статистический материал, полученный в результате моделирования, можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в одну и позволяет существенно увеличить информацию о свойствах исследуемой модели, а следовательно, и системы. Попарное использование для этих целей критериев Смирнова и Стьюдента для проверки нулевой гипотезы затруднено в связи с наличием большого числа выборок при моделировании системы. Поэтому для этой цели используется дисперсионный анализ.

Рассмотрим решение задачи дисперсионного анализа при обработке результатов моделирования системы на примере. Пусть генеральные совокупности случайной величины,, …, имеют нормальное распределение и одинаковую дисперсию. Необходимо по выборочным средним значениям при некотором уровне значимости у проверить нулевую гипотезу о равенстве математических ожиданий. Выявим влияние на результаты моделирования только одного фактора, т е рассмотрим однофакторный дисперсионный анализ.

Допустим, изучаемый фактор привел к выборке значений неслучайной величины следующего вида:, где - количество уровней фактора. Влияние фактора будем оценивать неслучайной величиной, называемой факторной дисперсией:

,

где среднее арифметическое значение величины.

Если генеральная дисперсия известна, то для оценки случайности разброса наблюдений необходимо сравнить с выборочной дисперсией, используя критерий Фишера (F -распределение). Если эмпирическое значение попадает в критическую область, то влияние фактора считается значимым, а разброс значений - неслучайным. Если генеральная дисперсия до проведения машинного эксперимента с моделью неизвестна, то необходимо при моделировании найти ее оценку.

Пусть серия наблюдений на уровне, имеет вид, где - число повторных наблюдений на м уровне. Тогда на м уровне среднее значение наблюдений:

,

а среднее значение наблюдений по всем уровням:

.

Общая выборочная дисперсия всех наблюдений

.

При этом разброс значений определяется суммарным влиянием случайных причин и фактора. Задача дисперсионного анализа состоит в том, чтобы разложить общую дисперсию на составляющие, связанные со случайными и неслучайными причинами.

Оценка генеральной дисперсии, связанной со случайными факторами:

,

а оценка факторной дисперсии:

.

Учитывая, что факторная дисперсия наиболее заметна при анализе средних значений на м уровне фактора, а остаточная дисперсия (дисперсия случайности) для средних значений в раз меньше, чем для отдельных измерений, найдем более точную оценку выборочной дисперсии:

.

Умножив обе части этого выражения на, получим в правой части выборочную дисперсию, имеющую ю степень свободы. Влияние фактора будет значимым, если при заданном выполняется неравенство. В противном случае влиянием фактора на результаты моделирования можно пренебречь и считать нулевую гипотезу о равенстве средних значений на различных уровнях справедливой.

Таким образом, дисперсионный анализ позволяет вместо проверки нулевой гипотезы о равенстве средних значений выборок проводить при обработке результатов моделирования проверку нулевой гипотезы о тождественности выборочной и генеральной дисперсий.

Возможны и другие подходы к анализу и интерпретации результатов моделирования, но при этом необходимо помнить, что их эффективность существенно зависит от вида и свойств конкретной моделируемой системы.

 

Заключение

 

Большое значение при реализации модели на ПЭВМ имеет вопрос правильного выбора языка программирования. Язык программирования должен отражать внутреннюю структуру понятий при описании широкого круга понятий. Высокий уровень языка моделирования значительно упрощает программирование моделей.

Основными моментами при выборе языка программирования для решения задачи моделирования (ЯМ) является: проблемная ориентация; возможности сбора, обработки, вывода результатов; быстродействие; простота отладки; доступность восприятия.

Наиболее известными языками моделирования являются SIMULA, SIMSCRIPT, GPSS, SOL, CSL и др. [2,3].


Литература

 

1. Замятина О.М. Моделирование сетей: учебное пособие / О.М. Замяти-на: Томский политехнический университет. – Томск: Изд-во Томского политехнического университета, 2011.

2. Советов Б.Я. Моделирование систем: Учеб. для вузов/Б.Я. Советов, С.А. Яковлев. – 6-е изд., стер. – М.: Высшая школа, 2009.

3. Моделирование систем: учебник для студ. высш. учеб. заведений/ С.И. Дворецкий, В.А. Погонин, А.Г. Схиртладзе – М.: Издательский центр «Академия», 2009.

4. Шелухин О.И., Тенякшев А.М., Осин А.В. Моделирование информационных систем/ Под ред. О.И. Шелухина. Учебное пособие. – М.: Радиотехника, 2005.

5. Бусленко Н.П. Моделирование сложных систем/ Н.П. Бусленко – М.:Наука, 1988.

 

 

<== предыдущая лекция | следующая лекция ==>
Технология развития у ребенка способности к самопринятию | Исследование лазерного интерференционного измерителя изменения толщины плоских объектов
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 3099; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.082 сек.