КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Лешек Рутковский
Председатель Польского общества нейронных сетей Введение
ГЛАВА1 ВВЕДЕНИЕ В последние годы большой интерес вызывает проблематика нейронных сетей, генетических алгоритмов и нечетких систем. Эти направления относятся к научной области, определяемой в англоязычной литературе термином Computational Intelligence. Взаимосвязи между нейронными сетями, генетическими алгоритмами и нечеткими системами послужили причиной того, что IEEE (Institute of Electrical and Electronics Engineers - США) создал Всемирный Конгресс Computational Intelligence [10]. В рамках этого конгресса в период с 26 июня по 2 июля 1994 г. в Орландо, штат Флорида (США) были проведены три конференции: а) IEEE International Conference on Neural Networks, б) IEEE International Conference on Fuzzy Systems, в) IEEE International Conference on Evolutionary Computation. В 1995 - 1997 гг. каждая из этих конференций проводилась независимо, но в 1998 г. вновь был организован Конгресс, проведенный на этот раз в Анкоридже на Аляске (США). На рис. 1.1. видно, что задачи нейронных сетей, генетических алгоритмов и нечетких систем могут рассматриваться вне связи между собой, однако их взаимозависимость оказывается необычайно важной. В частности, генетические алгоритмы можно применять для подбора весов и топологии нейронной сети, а также для формирования базы правил и функций принадлежности нечеткой системы.
В свою очередь, нейронные сети позволяют выбирать соответствующие параметры для самих генетических алгоритмов (параметры скрещивания и мутации); саму философию нейронных сетей можно заложить в фундамент нечетких систем, которые в результате обретают способность к обучению.
Кроме того, методы теории нечетких множеств позволяют подбирать как упомянутые выше параметры генетических алгоритмов, так и коэффициенты, определяющие скорость обучения нейронных сетей. В Польше перечисленные выше проблемы интенсивно исследуются во многих научных центрах. В области нейронных сетей первым достаточно полным и очень полезным изданием считается книга профессора Р. Тадеусе-вича [7]. В настоящее время некоторые фрагменты этой книги представляются автором также и на видеокассете [8]. В последующие годы увидели свет и другие издания: книга, подводящая итоги работы коллектива под руководством профессора Ю. Корбича [3], монография профессора С. Осовского [5] и работа, представляющая результаты исследований группы профессора Т. Каспшака в области клеточных нейронных сетей [2]. Следует также отметить факт, что некоторые монографии польских авторов известны и по достоинству оценены в мировой литературе. В частности, можно назвать: а) по нейронным сетям - книги профессора Я. Журады [9] и про б) по нечетким системам - книга профессора В. Педрыша [6]; в) по генетическим алгоритмам - книга профессора 3. Михалеви- Поскольку ни одно из упомянутых прекрасных изданий не охватывает одновременно все три ветви, объединяемые под названием «вычислительные технологии», авторы настоящей работы поставили перед собой задачу раскрыть перед читателем необычайно интересные возможности нейронных сетей, генетических алгоритмов и нечетких систем, а также их композиций. В главе 2 представлены основные структуры одно и многослойных нейронных сетей и алгоритмы их обучения. В первой части описывается перцептрон и системы типа Адалайн. Далее приводятся два алгоритма обучения многослойных нейронных сетей: классический и наиболее часто применяемый алгоритм обратного распространения ошибки, а также значительно более быстрый алгоритм, основанный на рекуррентном методе наименьших квадратов. В главе 3 обсуждаются системы, использующие нечеткую логику. Они особенно полезны в ситуации, когда доступные знания представлены в виде правил, основанных на нечетких множествах и лингвистических переменных. Системы этого типа де-факто признаны стандартом в Японии, где они применяются в автоматических стиральных и посудомоечных машинах, видеокамерах и фотоаппаратах, кондиционерах и автомобилях. Излагаются элементы теории нечетких множеств и нечеткого вывода, также описывается функционирование различных нечетких процессоров. Основам реализации генетических алгоритмов посвящена глава 4. Как известно, естественный путь развития мозга - это эволюционный процесс, с которым связаны специфические методы проб и ошибок. Идеи эволюционных изменений привели к созданию генетических алгоритмов, применяемых для обучения нейронных сетей и в системах, использующих нечеткую логику. В книге представляются не только раздельные описания нейронных сетей и нечетких систем, но и (в главе 5) новейшие результаты, получаемые при их объединении. Композиции этого типа сохраняют и усиливают достоинства как нейронных сетей, так и нечетких систем. Они потен-
Глава 1. Введение циально применимы во всех ситуациях, когда конструктор системы располагает и количественной (численные данные), и качественной (лингвистические правила) информацией. В конце каждой главы приводится список литературы. Вопросы, обсуждаемые в книге, подробно иллюстрируются имитационными примерами, реализованными с помощью следующих пакетов программ: 1. FLiNN (программа написана на кафедре Компьютерной инженерии 2. FlexTool (GA) M2.1 (Flexible Intelligence Group) - пакет, взаимодей 3. Evolver (Axcelis, Inc.) - пакет, взаимодействующий с программой 4. BrainMaker и Genetic Training Option (California Scientific Software); 5. Fide (Aptronix, Inc.); 6. Fuzzy Logic Toolbox - прикладной пакет программ комплекса MAT- Выражаем признательность господам Уве фон Аммон и Марку Скарбек-Козетульскому из фирмы Motorola, благодаря любезности которых мы получили пакет Fide. Первый опыт работы с перечисленными программными средствами мы приобретали совместно со студентами четвертого курса Политехнического университета г. Ченстохова по специальности «Электроника и компьютерная инженерия», которых хотелось бы поблагодарить за сотрудничество в ходе учебных занятий. Мы также сердечно благодарим госпожу Ренату Марчиняк и магистра инженера Артура Стажевского за труд по подготовке рисунков и рукописи. Особую признательность выражаем рецензентам - профессору Юзефу Корбишу и профессору Рышарду Тадеусевичу за внимательное ознакомление с рукописью и очень полезные замечания. Список литературы [1] Cichocki A, Unbehauen R., Neural Networks for Optimization and Signal Processing, Wiley, Chichester 1993. [2] Kacprzak Т., Slot K., Sieci neuronowe komorkowe. Teoria, projek- towanie, zastosowania, PWN, Warszawa-Lodz 1994. [3] Korbicz J., Obuchowicz A., Ucinski D., Sztuczne sieci neuronowe, podstawy i zastosowania, Akademicka Oficyna Wydawnicza, Warszawa 1994. [4] Michalewicz Z, Genetic Algorithms + Data Structures = Evolution Programs, Springer-Verlag, Berlin 1994. [5] Osowski S., Sieci neuronowe w ujeciu algorytmicznym, WNT, Warszawa 1996. [6] Pedrycz W., Fuzzy Control and Fuzzy Systems, Wiley, New York 1993. [7] Tadeusiewicz R., Sieci neuronowe, Akademicka Oficyna Wydawnicza, Warszawa 1993.
Tadeusiewicz R., Wprowadzenie do sieci neuronowych, kaseta wideo, Polskie Towarzystwo Sieci Neuronowych, Czestochowa 1996. Zurada J. M., Introduction to Artificial Neural Systems, West Publishing Company, Boston 1992. [10] Zurada J. M., Marks R. J., Robinson C. J., (red.), Computational Intelligence: Imitating Life, IEEE Press, New York 1994. 2.2. Нейрон и его модели
ГЛАВА2 МНОГОСЛОЙНЫЕ НЕЙРОННЫЕ СЕТИ И АЛГОРИТМЫ ИХ ОБУЧЕНИЯ 2.1. Введение Нейронные сети можно рассматривать как современные вычислительные системы, которые преобразуют информацию по образу процессов, происходящих в мозгу человека. Обрабатываемая информация имеет численный характер, что позволяет использовать нейронную сеть, например, в качестве модели объекта с совершенно неизвестными характеристиками. Другие типовые приложения нейронных сетей охватывают задачи распознавания, классификации, анализа и сжатия образов. Проблематика нейронных сетей в девяностых годах XX века нашла отражение в сотнях монографий, среди которых можно упомянуть изданные в Польше работы [10, 11, 13, 17, 24]1 и некоторые заграничные публикации [3, 5, 7, 8, 15, 21, 28]. Также следует упомянуть о прекрасных обзорных статьях, которые стали катализатором дальнейших исследований как в Польше (Р. Тадеушевич [22]), так и за границей (Р. Липпманн [14]). Свыше 80 % всех приложений нейронных сетей относится к так называемым многослойным сетям без обратных связей. В них сигнал пересылается в направлении от входного слоя через скрытые слои (если они имеются) к выходному слою. Сети именно такого типа будут рассматриваться в последующих главах книги в контексте генетических алгоритмов и нечетких систем. Поэтому в настоящей главе мы обсудим в первую очередь базовые элементы многослойных нейронных сетей - персептрон и системы типа Адалайн (с линейным и нелинейным выходом), после чего определим два алгоритма обучения этих сетей: алгоритм обратного распространения ошибки и рекуррентный алгоритм метода наименьших квадратов. Хотелось бы подчеркнуть, что в нашей монографии представляется достаточно узкий, однако весьма важный с прикладной точки зрения фрагмент необычайно обширной области знаний, которая получила название «искусственные нейронные сети». Приглашаем читателя к более углубленному изучению литературных источников, перечень которых приводится в конце главы. 2.2. Нейрон и его модели Базовый элемент нервной системы (см. [23]) - это нервная клетка, называемая нейроном. В нейроне можно выделить тело клетки, называемое сомой, а также исходящие из него два вида отростков: а) по которым в нейрон поступает информация - дендриты и б) по которому ней- рон передает информацию - аксон. Каждый нейрон имеет только один выходной отросток, по которому он может передавать импульс нескольким другим нейронам. Одиночный нейрон принимает возбуждения от огромного количества нейронов (их число может достигать тысячи). Считается, что мозг человека состоит из порядка 1011 нейронов, которые имеют между собой примерно 1015 соединений. Каждый нейрон передает возбуждение другим нейронам через нервные стыки, называемые синапсами, при этом процесс передачи сигналов имеет сложную электрохимическую природу. Синапсы играют роль репитеров информации, в результате функционирования которых возбуждение может усиливаться или ослабляться. Как следствие, к нейрону приходят сигналы, одна часть из которых оказывает возбуждающее, а вторая - тормозящее воздействие. Нейрон суммирует возбуждающие и тормозящие импульсы. Если их алгебраическая сумма превышает некоторое пороговое значение, то сигнал с выхода нейрона пересылается посредством аксона к другим нейронам. На рис. 2.1. представлена упрощенная модель нейрона. Рассмотрим модель нейрона, связанную с первыми попытками формализовать описание функционирования нервной клетки. Введем следующие обозначения: иь.... uN- входные сигналы данного нейрона, приходящие от других нейронов; wb..., wN - синаптические веса; у- выходной сигнал нейрона; v - пороговое значение. Формула, описывающая функционирование нейрона, имеет вид N 1 При У WjU; > V,
(2.1) 0 При
Переработанная версия монографии проф. С. Осовского [17] под названием «Нейронные сети для обработки информации» издана в 2002 г. на русском языке издательством «Финансы и статистика». - Прим. перев. Рис. 2.1. Упрощенная модель нейрона и его соединения с соседним нейроном: 1 - тело клетки, 2 - аксон, 3 - дендриты, 4 - синапсы. Глава 2. Многослойные нейронные сети и алгоритмы их обучения 2.2. Нейрон и его модели
где
1 при х>0 О при х<0 а также wo = v,uo=1. Формула (2.2) описывает модель нейрона, представленную на рис. 2.2. Эта модель была предложена в 1943 г. МакКаллоком и Питт-сом [16]. В качестве функции Сможет приниматься не только единичная функция (2.3), но и другие пороговые функции вида
1 при х>0, f(x) - | _ 1 при х < О.
1 при х> 1, f(x) = -j -1 при х < -1, х при |х|<1. На начальной фазе моделирования биологических нейронных сетей применялись пороговые функции (2.3), (2.4) и (2.5). В настоящее время чаще всего используется сигмоидальная функция, определяемая выражением «= тг^ * ° ■ <2-6)
Отметим, что при jS->~ характеристика (2.6) стремится к пороговой униполярной функции (2.3). В качестве альтернативы применяется функция гиперболического тангенса (2.7) В этом случае характеристика (2.7) стремится к пороговой биполярной функции (2.4) при а—>°=. Примеры функции fs модели (2.2) показаны на рис. 2.3.
Дата добавления: 2015-06-04; Просмотров: 741; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |