<<
>>

2.2.2. Обучение третьего слоя.

Как уже упоминалось необходимо реализовать отображение, которое будет однозначно идентифицировать классовую принадлежность образца, поскольку несколько областей пространства могут соответствовать одному классу.
Для этой цели можно использовать обычный (не RBF) слой нейронов с пороговой активационной функцией. Не отступая от идеи обучения отдельно каждого из нейронов, для каждого нейрона выходного слоя формируем квадратичный функционал, принуждающий нейрон реагировать на свой класс единицей, а на все остальные нулем.

min

г к

Функционал специально построен таким образом, что не содержит активационной функции и является квадратичной формой по

48

отношению к синаптическим весовым коэффициентам нейрона, поскольку известно, что такой функционал минимизируется при помощи метода сопряженных градиентов за конечное число шагов. Далее пусть тхо и mni соответственно максимальное значение отклика нейрона на элементах чужих классов и минимальное значение отклика нейрона на элементах своего класса. Если тхо < тптогда эти классы разделимы, обучение данного нейрона успешно, и он добавляется в сеть. В противном случае, т.е. когда хотя бы у одного из выходных нейронов условие тх0 <тп] не выполняется, необходим дополнительный слой RBF-нейронов. Этот слой обучается по вышеописанному алгоритму с исключением первого этапа и использованием только второго.

Таким образом, в результате получается слой нейронов, в котором на каждый элемент реагирует лишь один нейрон, и в этом случае, если необходимо отображение отличное от простой идентификации классовой принадлежности распознаваемого элемента, то веса последнего слоя нейронов вычисляются очевидным образом с использованием методов линейной оптимизации.

<< | >>
Источник: Стадник Алексей Викторович. Использование искусственных нейронных сетей и вейвлет-анализа для повышения эффективности в задачах распознавания и классификации. 2004

Еще по теме 2.2.2. Обучение третьего слоя.: