Вычисляется производная ошибки по входу активационной функции

Одним из наиболее проработанных методов обучения с учителем является метод обратного распространения, являющийся градиентным методом локальной оптимизации с вычислением производных первого порядка. Алгоритм обратного распространения был изобретен в 1974г. Полем Дж. Вербосом.

Согласно этому алгоритму вектор ошибки определяется как разность вектора выходов и эталонного вектора выходов. Подсчитывается квадрат модуля вектора ошибки, т.е. сумма квадратов разностей компонент указанных векторов. Затем меняются веса связей для минимизации ошибки. Каждый вес меняется на величину, пропорциональную скорости, с которой изменяется ошибка по мере изменения веса.

Обозначим индексом j выходной слой, i - предыдущий слой. Суммарная ошибка вычисляется следующим образом:

где Y_jk - выходная активность k -го нейрона j -го слоя;

D_jk - эталонный выход k -го нейрона j -го слоя.

Активность нейрона есть функция его входа, например сигма-функция:

где X_jk - суммарный взвешенный вход k -го нейрона j -го слоя, который вычисляется следующим образом:

где Y_il - выход l -го нейрона i -го слоя;

W_il^jk - вес связи;

суммирование проводится по всем нейронам i-го слоя, связанным с данным нейроном j-го слоя.

Алгоритм обратного распространения:

1. Вычисляется производная ошибки по активности выходного элемента:

выходного элемента:

<== предыдущая лекция	\|	следующая лекция ==>
Обучение с учителем	\|	Здесь последний множитель является производной сигмоиды, т.е. для другого вида активационной функции будут выглядеть по-другому

Поделиться с друзьями:

Дата добавления: 2014-01-20; Просмотров: 526; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.012 сек.