Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Методическая разработка. Для студентов iкурса фармацевтического факультета




для студентов I курса фармацевтического факультета

к практическому занятию по теме

«Применение пакета Statistica для анализа временных рядов»

1. Научно-методическое обоснование темы:

Нейронные сети - исключительно мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости. В частности, нейронные сети нелинейны по свой природе (смысл этого понятия подробно разъясняется далее в этой главе). На протяжение многих лет линейное моделирование было основным методом моделирования в большинстве областей, поскольку для него хорошо разработаны процедуры оптимизации. В задачах, где линейная аппроксимация неудовлетворительна (а таких достаточно много), линейные модели работают плохо. Кроме того, нейронные сети справляются с "проклятием размерности", которое не позволяет моделировать линейные зависимости в случае большого числа переменных.

Простота в использовании. Нейронные сети учатся на примерах. Пользователь нейронной сети подбирает представительные данные, а затем запускает алгоритм обучения, который автоматически воспринимает структуру данных. При этом от пользователя, конечно, требуется какой-то набор эвристических знаний о том, как следует отбирать и подготавливать данные, выбирать нужную архитектуру сети и интерпретировать результаты, однако уровень знаний, необходимый для успешного применения нейронных сетей, гораздо скромнее, чем, например, при использовании традиционных методов статистики. Нейронные сети привлекательны с интуитивной точки зрения, ибо они основаны на примитивной биологической модели нервных систем. В будущем развитие таких нейро-биологических моделей может привести к созданию действительно мыслящих компьютеров. Между тем уже "простые" нейронные сети, которые строит система ST Neural Networks, являются мощным оружием в арсенале специалиста по прикладной статистике.

2. Краткая теория:

Идея нейронных сетей в статистике разрабатывается не первое десятилетие. Как и любой другой статистический продукт, нейронные сети имеют свои ограничения. Их нецелесообразно использовать там, где достаточно односложные ответы можно получить, применяя дисперсионный, регрессионный, кластерный или факторный анализы, не говоря уже о первичной обработке данных – описательных приемах. Но в ситуациях, когда надо разгрести «завал» данных, получение осмысленного результата из которого проблематично, - тут-то нейронные сети и могут облегчить участь исследователя.

Основная идея нейронных сетей в том, что они механически повторяют структуру действительного нейрона (нервной клетки) мозга человека: эта клеточная структура имеет несколько отростков – входные - дендриты (их может быть несколько) и один выходной – аксон. Нейрон начинает передавать информацию через синапсы (узлы связи) другим нейронам только в случае, когда возбужден, или иначе, переполнен, информацией. Дозируя информацию, можно регулировать активность нейрона.

И на этом фоне удивительной чертой нейронных сетей является их способность к обучению, чего начисто лишены основные методы статистического анализа. В данном варианте реализуется действительная структура человеческого мозга: во-первых, принимать решение, опираясь на функцию памяти о прошлом опыте; во-вторых, действовать по ассоциации, используя обрывочные сведения о предмете анализа.

Систем обучения нейронных сетей достаточно много: У. Маккалоха, Д. Хебба, М. Минского, Дж. Хопфилда…

1. Откроем пакет, войдем в модуль Нейронные сети.

2. Через (Файл новый) выберем команду (Сеть).

3. На экране появится (Создать сеть)- (Create Network).

4. В поле (Тип) выбираем (Многослойный персептрон) и делаем установки: Вход=1, Выход=1.

5. Зададим число слоев сети равное трем, т.е. выбираем трехслойный персептрон.

6. Временное окно(Steps) пометим «12», это будет отвечать ежемесячной регистрации заболеваемости дизентерией с присущей сезонной составляющей.

7. Горизонт (Lookahead) пометим «1».

8. На экране монитора справа появится схема персептрона. Поскольку модель определена, необходимо сеть обучить. Для этого надо задать 66 обучающих (Training) и контрольных (Verification) наблюдений.

9. Далее перемешиваем данные (Shuffle), поскольку мы анализируем временный ряд, а порядок данных очень важен в соответствии с временными промежутками, то исключается использование кнопкой Сгруппировать (Group Sets).

10. Откроем командой Запуск окно Проекция временного ряда(Time Series Projection). Ряд можно построить целиком или с какого-то интересующего нас момента. Графически кривая идет достаточно круто вверх, число прогнозируемых случаев не имеет тенденции к снижению, колеблясь в пределах 1000,0 – 1020,0 на 10000 населения.

11. Проверим качество работы обученной сети, открыв окно Статистики регрессии, включим Запуск(Run).

12. Для того, чтобы получить прогноз на один шаг вперед в меню Запуск(Run) выберем команду (Single Case), откроется соответствующее диалоговое окно, где надо ввести номер наблюдения, для которого строится прогноз, жмем вверху справа кнопку (Run), в строке Output получим искомый результат прогноза. Введя для примера 13, получим прогнозируемый уровень 1011,231. Оценивая значимость входов, определим, что из четырех выбранных факторов ведущими (по величине объясненной дисперсии) является детская заболеваемость: 0,567 и оперативная эффективность: 0,451. Точность прогноза на среднем уровнен, что объясняется малым объемом обучающей выборки, и тем, что велика вероятность, что процесс по годам нестационарен.

 

3. Цель деятельности студентов на занятии:

Студент должен знать:

1. Основную структуру пакета Statistica 6.0 6.0.

2. Процесс ввода данных в таблицу Spreadsheet, сохранение файлов и открытие существующих.

3. Приемы описательной статистики.

4. Основные методы статистической обработки данных.

 

Студент должен уметь:

1.Владеть базовыми средствами для создания, редактирования, форматирования таблиц в пакете Statistica 6.0. В необходимой мере владеть навыком по осуществлению статистической обработки данных с применением современных программно-технических средств, в частности, с помощью возможностей данного пакета.

2.Эффективно использовать пакет Statistica 6.0 для более глубокого статистического исследования, с показателями корреляции, регрессии и описательной статистики.

3. Проводить анализ временных рядов с использованием пакета Statistica 6.0.(нейронные сети).

 

4. Содержание обучения:

Теоретическая часть:

1. Формирование таблиц. Ввод числовых и текстовых данных;

2. Сохранение файлов и открытие существующих.

3. Использование пакета анализа.

4. Получение прогноза динамики заболеваемости.

 

Практическая часть:

Дан динамический ряд числа заболеваний дизентерией за год. Предварительно была сформирована помесячная таблица анализируемых реальных данных, она была сохранена на диске в конкретной папке. И выделены из 11 входящих четыре основные: 1) детская заболеваемость дизентерией, 2) число порывов на водоводной сети, 3) качество профилактической работы персонала в очагах, 4) оперативная эффективность. Необходимо получить прогноз динамики заболеваемости и определить, какой из четырех отобранных факторов является ведущим.

месяц Заболеваемость детей дизентерией на 1000 чел. Число порывов водоводной сети, абс. Качество проф.работы в очагах, баллы Оперативная эффективность, % Число случаев дизентерии(в расчете на 10000 чел.)
1. 20,1       300,1
2. 31,1       423,1
3. 41,1       321,4
4. 43,1       444,4
5. 50,1       600,9
6. 53,1       789,9
7. 55,1       988,8
8. 60,1       1012,1
9. 60,1       1112,4
10. 66,6       1123,3
11. 67,1       1109,8
12. 67,8       899,2

 

5. Перечень вопросов для проверки исходного уровня знаний:

1. Какую структуру имеет пакет Statistica 6.0?

2. Особенности пакета Statistica 6.0.

3. Как вводятся данные в таблицу пакета Statistica 6.0?

4. Как происходит статобработка данных?

 

6. Перечень вопросов для проверки конечного уровня знаний:

1. Понятие Нейронные сети.

2. Понятие персептрона.

3. Построение временного ряда.

 

8.Хронокарта учебного занятия:

1.Организационный момент – 5 мин.

2.Текущий контроль знаний – 30 мин.

3.Разбор темы – 20 мин.

4.Практическая работа – 30 мин.

5.Подведение итогов занятия – 10 мин.

9.Самостоятельная работа студентов.

Использование многомерных статистических методов в статистической обработке медицинских данных.

10.Перечень учебной литературы к занятию:

1. Кобринский Б.А., Зарубина Т.В.

«Медицинская информатика», М., Издательский дом «Академия», 2009.

2. Жижин К.С. «Медицинская статистика», Высшее образование, 2007.

3. Лекция по данной теме.

 




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 412; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.