КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Явление переобучения сети
Обучение нейроних мереж Для того чтобы любая сеть начала работать ее как и человека необходимо обучить.
1.4.1. Характеристика методов обучение Как только начальные веса и сдвиги нейронов установленные пользователем или с помощью датчика случайных чисел, сеть готовая для того, чтобы начать процедуру ее обучения. Процесс обучения требует набора примеров ее желательного поведения – входов р и желательных (целевых) выходов t; во время этого процесса веса и сдвиги настраиваются так, чтобы минимизировать некоторый функционал ошибки. В качестве такого функционала для сетей с прямой передачей сигналов принимается среднеквадратичная ошибка S между вектором t и вектором а отклика сети при заданных р. Потом с помощью того ли другого метода обучения определяются значение настраиваемых параметров (весов и сдвигов) сети, которые обеспечивают минимальное значение функционала ошибки S. Обучение многослойной сети включает несколько шагов: · выбор начальной конфигурации сети с использованием, например, следующего эвристического правила: количество нейронов промежуточного слоа определяется половиной суммарного количества входов и выходов; · проведение ряда экспериментов с разными конфигурациями сети и выбор той, которая дает минимальное значение функционала ошибки; · если качества обучения недостаточно, следует увеличить число нейронов или количество слоев; · если наблюдается явление переобучения, следует уменьшить число нейронов в слое или удалить одних или несколько слоов. С учетом специфики многослойных нейроних мереж для них разработанные специальные методы расчета градиента, среди которых следует выделить метод обратного распространения ошибки [7, 11, 13]. Одна из более всего серьезных трудностей при обучение сети состоит в том, что в ряде случаев минимизируется не та ошибка, которую на самом деле надо минимизировать: необходимо минимизировать ошибку, которая появляется в сети, если на нее подаются целиком новые наблюдения. Очень важно, чтобы нейроная сеть имела возможность приспосабливаться к этим новым наблюдениям. Что же происходит на самом деле? Сеть учится минимизировать ошибку на некотором ограниченном учебном множестве. Сети с большим количеством весов могут воссоздавать очень сложные функции, и, в этом случае, они склонны к переобучения. Сеть с небольшим количеством весов может оказаться недостаточно гибкой, чтобы смоделировать имеющуюся зависимость. Например, однослойная линейная сеть способная воссоздавать только линейные функции. Если использовать многослойные линейные сети, то ошибка всегда будет меньшее, но это может свидетельствовать не о качестве модели, а о том, что проявляется явление переобучения. Для того чтобы обнаружить эффект переобучения, используется механизм контрольной проверки. Часть учебных наблюдений резервируется как контрольные наблюдения и не используется при обучение сети. Вместо этого в зависимости от работы алгоритма эти наблюдения применяются для независимого контроля результата. Сначала ошибка сети на учебной и контрольной множествах будет одинаковой; если они существенно отличаются, то, вероятно, это означает, что разбивка наблюдений на 2 множества не обеспечила их однородность. По мере обучение сети ошибка убывает, и, пока обучение уменьшает функцию ошибок, ошибка на контрольном множестве также будет убывать. Если же контрольная ошибка перестала уменьшаться или стала возрастать, это указывает на то, что сеть начала слишком близко отвечать учебным данным и обучение следует остановить. В этом случае следует уменьшить количество нейронов или прослоек, так как сеть есть слишком мощной для решения данной задачи. Если же, наоборот, сеть имеет недостаточную мощность, чтобы воссоздать имеющуюся зависимость, то явление переобучения наблюдаться не будет и обе ошибки – обучение и проверки – не достигнут достаточно маленького уровня. При этом перебираются варианты многие архитектуры сети. Необходимость многократных экспериментов ведет к тому, что контрольное множество начинает играть ключевую роль в выборе модели нейроної сети, то есть становится частью процесса обучение. Тем самым его роль как независимого критерия качества модели ослабляется, поскольку при большом числе экспериментов возникает риск переобучения нейроної сети на контрольном множестве. Для того чтобы гарантировать надежность модели сети, которая выбирается, резервируют еще тестовое множество наблюдений. Итоговая модель тестується на данных из этого множества, чтобы убедиться, что результаты, которые достигнутые на учебному и контрольному множествах есть реальные. Разумеется, для того чтобы доброе выполнять свою роль, тестовое множество должно быть использована только 1 раз: если ее использовать повторно для корректирования процесса обучение, то она фактически превратится в контрольное множество. Итак, процедура построения нейроної сети состоит из таких шагов: § выбору начальной конфигурации сети; § моделирование и обучение сети с оценкой контрольной ошибки и использованием дополнительных нейронов или промежуточных слоев; § выявление эффекта переобучение и корректирование конфигурации сети.
Дата добавления: 2015-06-04; Просмотров: 697; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |