КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Постановка задачВо 2-ой половине XX в. объем экспериментальных знаний о деятельности мозга достиг величины, позволяющей проводить адекватную систематизацию этих знаний в рамках формализованных моделей, среди которых наибольшее предпочтение сейчас отдается нейросетевым моделям. Имеющийся опыт требует, чтобы такие модели воспроизводили наиболее важные особенности деятельности мозга и, прежде всего, его памяти: 1). Ассоциативность и устойчивость ассоциативных связей. Информация об объектах окружающего мира в памяти мозга фиксируется в виде некоторых образов (гештальтов), каждый из которых, в рамках нейросетевой модели, представляется определенным ансамблем нейронов с фиксированной структурой ассоциативных связей между нейронами этого ансамбля. Сам процесс формирования таких нейроансамблей в данном случае выступает как процесс обучения соответствующей нейросети распознаванию определенного объекта, информация о котором поступает из внешнего информационного пространства на входы сети. Довольно часто обучение сети реализуется путем многократной прогонки информации об интересующем объекте по обучаемой сети до тех пор, пока не происходит стабилизация весов ассоциативных связей между нейронами сети, после чего объект достаточно четко идентифицируется и запоминается сетью. Важно также, чтобы представленный нейросетью образ распознавался по неполной информации, как это наблюдается при естественной деятельности мозга. Иными словами, реальный образ может несколько отличаться от своего «эталонного» образа в памяти сети, но при этом достаточно четко идентифицироваться. Формально это сводится к определению нормы в пространстве образов X, так, что, если существует определенное значение
то представленный образ Можно видеть, что неравенство (11.1) в пространстве Х определяет некоторое бинарное отношение Представление о толерантном пространстве впервые появилось в работе О.Бьюнемана и Э.Зимана (1970) [24] именно для описания поведения мозга, когда процесс передачи информации между функциональными элементами структуры мозга описывается посредством соответствующих толерантных преобразований. В этой связи можно привести следующие характерные примеры. Модель памяти. Известно [23], что нервные волокна идущие к коре мозга, проходят через таламические центры, причем, таламус участвует в формировании практически всех рефлексов, за исключением простейших. Пусть Х – пространство внешних стимулов, а С;Т – пространства, описывающие состояния коры и таламуса. Тогда процесс формирования образов памяти (в таламусе) представляется в виде следующей схемы толерантных отображений
, (11.2)
где f, g, h, k – соответствующие толерантные отображения. Вербальное общение. В этом случае процесс передачи информации происходит по схеме: мысли 2). Дистрибутивный принцип хранения информации и надежность сети. По имеющимся данным [20;23;25], в мозге за хранение информации о конкретном объекте, как правило, отвечает не отдельный нейрон, а их некоторый структурированный ансамбль, так, что информация об объекте некоторым образом распределена по нейросети. Такой дистрибутивный принцип в управлении информацией, по сравнению с «фон-неймановской» архитектурой современных компьютеров, оказывается намного эффективнее, поскольку позволяет реализовать параллельные алгоритмы обработки информации, обеспечивающие одновременное разрешение многообразия проблем. Естественно, данный принцип должен востребоваться в нейросетевых моделях, правда, создание параллельных алгоритмов, как выясняется [20;26], представляет довольно сложную задачу. Кроме того, желательно, чтобы, как и в мозге, для нейросетевых моделей поддерживался достаточно высокий уровень надежности. По некоторым рекомендациям [20], вероятность правильного распознавания объектов для таких моделей должна быть близкой к 1 даже тогда, когда в сети отказывает до 50% элементов. 3). Универсальность и адаптивность сети. Как и мозг, сеть должна оптимально кодировать входной сигнал, реализуя универсальную обработку всевозможной внешней информации (зрительной, звуковой, обонятельной и т.п.). При этом следует предусмотреть возможность перенастройки сети с решения одного класса проблем на другой, тем самым, обеспечивая в необходимой мере адаптивность сети по отношению к внешнему информационному пространству. 4). Быстрый доступ к информации. Несмотря на крайне медленную (~ 100 м/с), по сравнению с компьютерами (~ 1). Определение функциональных характеристик нейронов; 2). Задание общей архитектуры сети; 3). Указание правил взаимодействия между нейронами; 4). Описание алгоритма обучения сети, т.е. алгоритма формирования ассоциативных связей и их «развесовки» в соответствии с целями обучения. Нейросеть должна адекватно реагировать на те образы, для распо-знавания которых она обучена. Например, если речь идет об учебном процессе, то в памяти нейросети должны содержаться образы (фрагменты) соответствующего программного (учебного) материала, а на вход этой сети поступают ответы обучаемого контингента по данному материалу, которые в процессе распознавания оцениваются или корректируются с помощью набора help-функций.
11.4. Нейросетевое обучение в дискретной модели Хопфилда/ Нейросеть как модель представляет собой динамическую систему Модель Хопфилда [20;27;28] представляет собой следующую нейросетевую идеализацию. Полагается, что множество состояний Динамика нейрона у Хопфилда описывается в рамках традиционной модели нейрона Мак-Каллока – Питтса. Пусть s(t+1)=sign(h(t))= В теории нейронных сетей считается, что всякая пара нейронов сети формально взаимосвязана. Поэтому, имея ввиду конечность множества нейронов Ne, пронумеровав элементы Ne, можно положить Ne={1;2;…;n}, где n – количество нейронов в сети, и тогда можно определить множество связей
где
Система нелинейных рекуррентных (разностных) уравнений 1-го порядка (11.5) описывает эволюцию нейросети
предъявляемый сети для распознания, определяет начальные условия для системы (11.5), а динамика изменения весов
Соотношения (11.5), (11.6), (11.7) полностью определяют эволюцию нейросети Механизм обучения в нейросетевой модели Хопфилда (11.5), (11.6), (11.7) тесно связан с качественной теорией нелинейного дифференциального уравнения Сопоставим аттракторам рассматриваемого уравнения набор ключевых образов
при Рассмотрим теперь разностную аппроксимацию уравнения (11.8) по методу Эйлера:
Если Нетрудно заметить, что каждое уравнение системы (11.5) с условием (11.6) приводится к виду (11.9). Действительно, полагая
где
11.5. «Нейросетевая педагогика» и ее приложения. Как отмечалось (пп.11.1;11.2), в человеческом мозге путем самоорганизации нейронных ансамблей (гештальтов), формируются исключительно эффективные алгоритмы обучения, обеспечивающие необходимую коррекцию и самонастройку соответствующих программ. Поэтому цели нейродинамики – адекватно описать и воспроизвести эти алгоритмы на уровне абстрактных нейросетевых моделей, реализация которых в учебном процессе составляет предметную область «нейросетевой педагогики». Одним из таких алгоритмов является нейросетевая модель обучения Хопфилда (п.11.4.), наглядно демонстрирующая, каким образом в принципе может быть организована память в сети, составленной из «не полностью надежных» элементов. Дидактически, в модели Хопфилда, по сути, реализуется хорошо известная процедура «натаскивания» субъекта на выполнение определенной деятельности. Отличаясь простотой и наглядностью, нейросеть Хопфилда, тем не менее сейчас является наиболее востребованной моделью и, например, дает адекватное описание таких практически важных объектов статистической физики, как спиновые стекла [20;29]. В целом, можно выделить три класса задач, реализуемых в рамках модели Хопфилда. Классификация (распознавание образов). В этом случае, по заданному конечному набору признаков объекта, требуется классифицировать или идентифицировать данный объект [1]. Теоретические аспекты и некоторые приложения таких задач рассмотрены выше (пп.10.2;10.3), поэтому здесь обращается внимание на следующий важный момент. Поскольку нейросетевой подход реализует в себе одновременно быстродействие компьютера и способность мозга к обобщению и распознаванию, то нейросетевые модели оказываются особенно эффективными в задачах экспертной оценки. В работах [30-32] разработана математическая модель ЭС для реализации процедуры развивающего обучения в виртуальном образовательном пространстве. Наиболее трудоемким процессом при создании такой ЭС является формирование ее базы данных, которая выстраивается по экспертным оценкам и использование нейросетевой концепции обучения в этом случае оказывается очень эффективным. В настоящее время нейросетевые модели широко используются в разных сферах [33]. С помощью нейросетевых моделей удается отслеживать и пресекать сомнительные операции с кредитными картами и банковскими чеками. На сегодняшний день система фирмы ITC, обеспечивающая безопасность кредитных карт Visa, в 1995 г. предотвратила нелегальные сделки на сумму более 100 млн. долл. Среди других областей приложения нейросетей можно указать медицинские диагностические ЭС, системы распознавания речи, оценки перспективности предприятий и др. Кластеризация и поиск закономерностей. Кластерный анализ (или кластеризация) – это процедура упорядочивания объектов в сравнительно однородные классы на основе попарного сравнения этих объектов по предварительно определенным и измеренным критериям. При обучении в рамках данной процедуры обеспечивается реализация дидактических принципов системности и последовательности так, что, например, всякий учебник «кластеризован» по главам и, более мелко, по параграфам, которые тематически более-менее однородны и расположены в определенной последовательности: в физике раздел «Механика» содержит три кластера – статику, кинематику и динамику; школьный курс биологии состоит из ботаники, зоологии и физиологии человека; изучение русского языка включает фонетику, морфологию и синтаксис и т.д. Школьный учитель обычно проводит кластеризацию класса по успеваемости (отличники, хорошисты, троечники и двоечники). В экономике посредством кластерного анализа, например, удается эффективно выявлять фальсифицированные страховые случаи или маргинальные предприятия [33]. Факторный анализ (как поиск закономерностей) имеет своей задачей выделение факторов, которые интерпретируются как латентные причины взаимосвязи групп переменных, описывающих свойства изучаемого объекта. С помощью нейросети в рамках метода МГУА (метод группового учета аргументов), например, удается построить зависимость одного параметра от других в виде полинома. Вообще говоря, если в качестве элементов классификации выступают переменные, а в качестве мер их близости (или различия) – корреляции между ними, то, таким образом, фактически, происходит кластеризация свойств рассматриваемого объекта. В педагогике типичными примерами таких корреляций являются зависимости успеваемости от скорости чтения и скорости чтения по годам обучения школьников [34], кривая забывания Г. Эббингауза (1885, [35]) и др. Прогнозирование. Задачей прогноза является построение научно-обоснованного суждения о возможных состояниях интересующего объекта в будущем, а также альтернативных путях и сроках их осуществления. В рамках нейросетевой модели прогноз сводится к анализу структур нейросети,которые возникают в рамках тех или иных гипотез о ее вероятном поведении в будущем, и выделению из этих конфигураций наиболее вероятной структуры, например, исходя из принципа минимизации энтропии системы. По современным представлениям нелинейной динамики [36], модели прогнозирования подразделяются на три класса. К первому классу относятся модели, описывающие процессы в системе, эволюция которой однозначно определяется ее начальными условиями и, таким образом, будущее данной системы полностью прогнозируемо по ее предыстории. Иными словами, это класс детерминированных моделей, включающий, например, консервативные системы, поведение которых описывается в рамках классической механики. В обучении и образовании модели такого класса представляют макроподход к описанию педагогического процесса, при котором полностью абстрагируются от изучения его внутренних состояний и характер процесса исследуется по входной и выходной информации, т.е. внутренняя структура и состояния педагогического процесса рассматриваются как «черный ящик». В 70-х гг. прошлого века в рамках такого подхода Р.Э. Авчухова построила модель управления процессом усвоения изучаемого содержания в виде дифференциального уравнения, а В.И. Михеевым была реализована дискретная модель оптимизации самостоятельной работы студентов высшей школы [37]. Второй класс включает модели, отвечающие процессам, в которых будущее не зависит от прошлого, что равносильно отсутствию причинно-следственных связей между состояниями в таких процессах. Это класс стохастических моделей, к которому, например, относится система массового обслуживания. В образовании некоторое время считали, что, в силу неоднозначности хода педагогического процесса, описание сущности и связей педагогических явлений может строиться только в рамках теории вероятности [37;38]. В 70-х гг. XX в. обнаружился третий класс моделей, описывающих процессы в системах, эволюция которых обладает особенностями, например, бифуркацией. Развитие таких систем потенциально может иметь несколько сценариев и, какой из них конкретно реализуется, зависит от предыстории данного процесса, однако всегда является результатом малых воздействий в определенные моменты времени при определенных состояниях системы (в точках бифуркации). Иными словами, будущее в таких системах неоднозначно и зависит от более ранних состояний данной системы. Этот класс моделей отвечает эволюции открытой системы при ее взаимодействии с внешней средой и характерным для него является то обстоятельство, что у таких систем существуют принципиальные ограничения на временной период прогноза. Например, для прогноза погоды – это примерно две недели, а для динамики океана – около месяца. Есть основания полагать, что к данному классу относится большинство открытых систем, рассматриваемых в биосфере, экологии, теории цивилизаций, а также в госуправлении и, в частности, в образовании. Имеющийся опыт показывает, что прогнозы в области образования, пока, в основном, строятся по экспертным оценкам, которые, как правило, скоррелированы со сценариями экономического развития государства [39;40]. Судя по всему, по экспертным оценкам построена «Национальная доктрина развития образования в РФ» (2000-2025 гг.) [41], в рамках которой прогнозируется сценарий развития российского образования на 25 лет. Впрочем, во время дискуссии при принятии данного государственного документа ректором МГУ им. М.В.Ломоносова В.А. Садовничим приводились доводы в пользу сокращения срока прогноза до 15 лет, однако они оказались в меньшинстве.
Дата добавления: 2014-01-05; Просмотров: 405; Нарушение авторских прав?; Мы поможем в написании вашей работы! |