2.2.6 Оценка скоростей обучения

В выражении (2.16) параметр rj по сути является мерой точности обучения сети. Чем он больше, тем более грубым будет следующее уменьшение суммарной ошибки сети. Чем он меньше, тем больше времени сеть будет тратить на обучение и тем более возможно ее попадание в окрестность локального ми-нимума ошибки.

Поэтому управление величиной шага имеет важное значение для улучшения сходимости обучения нейронной сети.

В настоящее время существует множество различных схем (большинство из них эмпирические) для автоматической настройки скорости обучения [7175]. Большинство из этих схем уменьшает скорость обучения, когда синаптический коэффициент «колеблется», и увеличивает его, когда весовой коэффициент следует по относительно устойчивому направлению. Главная проблема с этими методами состоит в том, что они являются не подходящими для онлайн- обучения.

Интуитивно понятно, что выбор индивидуальной скорости обучения для каждого синаптического коэффициента может ускорить сходимость и улучшить качество решения (в зависимости от поверхности функции ошибки, некоторые синаптические коэффициенты могут требовать небольшой скорости обучения, чтобы избежать расхождения, в то время как другие могут требовать большого значения скорости обучения, чтобы ускорить схождение алгоритма).

Поэтому в данной работе каждому синаптическому коэффициенту дана индивидуальная скорость обучения.

Для автоматической подстройки скорости обучения на каждой итерации обучения использовался алгоритм, предложенный в работе [73]. Данный метод основывается на следующих фактах:

наименьшее собственное значение матрицы Гессе Н ,,= ^ ^ , гораздо

dWidWi

меньшее чем второе наименьшее собственное значение

после большого количества итераций, вектор параметров приблизится

к минимуму целевой функции по направления минимального собственного вектора матрицы Гессе, как показано на рисунке 2.7.

Рис 2.7.

Сходимость процесса обучения нейронной сети.

При этих условиях об изменении параметра скорости обучения можно предполагать как об одномерном процессе, и минимальный собственный век-

1dE\ t dw

тор v может быть оценен (для большого количества итерации) v =

'dET

{dwi dE_

{dwi

т dE

Следовательно, можно записать ? = (v —) =

для оценки минимального собственного вектора v как одномерной меры расстояния до ми-

нимума. Это расстояние может использоваться, чтобы управлять скоростью обучения. Таким образом, итоговые соотношения выглядят:

r(f + l) = (l-Ј)r(r) + J^,(0<Ј+ = + + (2Л8)

где S,a,p являются константами;

г используется как вспомогательная переменная, чтобы вычислить среднее значение градиента.

Данный набор правил прост для вычисления. Просто нужно держать направление дополнительного вектора (2.17) усредненного градиента г. Норма этого вектора управляет размером скорости обучения (2.18). Алгоритм исходит из простой интуиции: далеко от минимума (большое расстояние ?) осуществляются большие шаги, при близости к минимуму скорость обучения уменьшается.

<< | >>

↑

Источник: Макаренко Алексей Александрович. Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей: диссертация... кандидата технических наук: 05.13.18. - Москва: РГБ, 2007. 2007

Еще по теме 2.2.6 Оценка скоростей обучения:

- Автомобили, автомобилестроение - АЗС, нефтепродукты - Биотехнология - Геология - Дисертации по истории - Дисертации по праву - Диссертации по международным отношениям - Диссертации по праву - Диссертации по психлогии - Диссертации по теоретической физике - Диссертации по экономике - Компьютеры, радиотехника, электроника - Мелиорация, рекультивация и охрана земель - Мода - Обогащение полезных ископаемых - Отопление, котлы, водоснабжение, электроснабжение - Промышленнось России - Создание сайтов, интернет - Технологии и средства механизации сельского хозяйства - Технология мясных, молочных, рыбных продуктов - Технология производства продуктов животноводства - Философия -

- Архитектура и строительство - Безопасность жизнедеятельности - Библиотечное дело - Бизнес - Биология - Военные дисциплины - География - Геология - Демография - Диссертации России - Естествознание - Журналистика и СМИ - Информатика, вычислительная техника и управление - Искусствоведение - История - Культурология - Литература - Маркетинг - Математика - Медицина - Менеджмент - Педагогика - Политология - Право России - Право України - Промышленность - Психология - Реклама - Религиоведение - Социология - Страхование - Технические науки - Учебный процесс - Физика - Философия - Финансы - Химия - Художественные науки - Экология - Экономика - Энергетика - Юриспруденция - Языкознание -