1.2.1 Искусственные нейронные сети в системах распознавания
Нейронные сети [46-48] применяются для решения задач классификации или кластеризации многомерных данных. Несмотря на существенные различия, отдельные типы нейронных сетей обладают несколькими общими чертами.
Первая, основу каждой нейронной сети составляют относительно простые, в большинстве случаев - однотипные, элементы (ячейки), имитирующие работу нейронов мозга.
Второй общей чертой присущей нейронным сетям является принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.
Рис.
1.2. Структура связей однослойной нейронной сетиТеоретически число слоев и число нейронов в каждом слое может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется нейронная сеть. Чем сложнее нейронная сеть, тем масштабнее задачи, подвластные ей.
Процесс функционирования нейронной сети зависит от величин синап- тических связей, поэтому, задавшись определенной структурой нейронной сети, отвечающей какой-либо задаче, необходимо найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными). Этот этап называется обучением нейронной сети, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время эксплуатации.
Нейронные сети давно и успешно применяются для решения многих задач распознавания. Преимуществом использования нейросетей для решения задачи обнаружения лица является возможность получения классификатора, хорошо моделирующего сложную функцию распределения изображений лиц р(х | face).
Недостатком является необходимость в тщательной и кропотливой настройке нейронной сети для получения удовлетворительного результата классификации.Основные преимущества, которыми обладают нейронные сети следующие.
Настройка нейронной сети для решения определённой задачи производиться в процессе обучения на наборе тренировочных примеров. Таким образом, не требуется вручную определять параметры модели (выбирать ключевые признаки, учитывать их взаимоотношение и т. п.) - нейронная сеть извлекает параметры модели автоматически наилучшим образом в процессе обучения. Необходимо только построить тренировочную выборку. В задачах классификации при этом происходит неявное выделение ключевых признаков внутри сети, определение их значимости и системы взаимоотношений между признаками. В настоящее время разработаны мощные, гибкие и универсальные механизмы обучения различных типов нейронных сетей. Кроме того, архитектура нейронной сети и процедура обучения позволяет гибкую настройку на конкретную решаемую задачу. Для большинства нейронных сетей процедура обучения является эвристическим алгоритмом, что с одной стороны обеспечивает приемлемость получаемых решений, а с другой стороны не требует непомерных вычислительных ресурсов. Существуют три парадигмы обучения: "с учителем", "без учителя" (самообучение) и смешанная. В первом случае нейронная сеть располагает правильными ответами (выходами сети) на каждый входной пример. Веса настраиваются так, чтобы сеть выдавала ответы как можно более близкие к известным правильным ответам. Усиленный вариант обучения с учителем предполагает, что известна только критическая оценка правильности выхода нейронной сети, но не сами правильные значения выхода. Обучение без учителя не требует знания правильных ответов на каждый пример обучающей выборки. В этом случае раскрывается внутренняя структура данных или корреляции между образцами в системе данных, что позволяет распределить образцы по категориям. При смешанном обучении часть весов определяется посредством обучения с учителем, в то время как остальная получается с помощью самообучения.
Нейронные сети обладают хорошей обобщающей способностью.
Это значит, что опыт, полученный в процессе обучения на конечном наборе образов, нейронная сеть может успешно применять на всё множество образов. Кроме интерполяционных обобщающих способностей, нейронные сети, могут хорошо экстраполировать, то есть применять свой опыт на качественно иные образы, чем те, которые встречались в обобщающей выборке.Нейронные сети не требуют ни наложения каких-либо ограничений на тренировочную выборку, ни полагаются на то, что она обладает какими-либо априорными свойствами, в отличие, например, от статистических методов. Не требуется никакого предварительного изучения характера данных. Нейронная сеть принимает тренировочный набор «как есть» и учится производить правдоподобное решение, не претендуя на абсолютную истину. То есть, строится наилучшая нефизическая модель, которая не является максимально точным соот-ветствием реального процесса, но даёт приемлемую его аппроксимацию. Имеется ряд примеров, когда нейронные сети показывали себя лучше статистических методов. Кроме того, в статистике не имеется аналогов некоторых нейро- сетевых методов, таких, например как карты Кохонена, машина Больцмана, и, что важно для распознавания изображений - когнитроны.
Естественным образом архитектура нейронных сетей реализуется на параллельных вычислительных средствах: специализированных микросхемах, оптических и квантовых компьютерах. Это открывает широкие перспективы применения нейронных сетей в будущем. Нейронная сеть характеризуется нечётким и распределённым хранением информации. То есть, нет отдельного нейрона, отвечающего за какое-либо понятие или признак, и удаление или искажение работы этого нейрона не приведёт к фатальным последствиям.
Но, несмотря на все достоинства, применение нейронных сетей к изображениям требует специальных усилий. Это связано в первую очередь со сложным характером изображений, особенно изображений трёхмерных объектов реального мира, какими и являются лица людей.
Для решения задачи обнаружения лица на изображении применялось большое количество нейронных сетей различных архитектур, рассмотрим вкратце основные из них: