Наведение путем сопоставления базового и текущего изображений, распознавание сложных образов и сцен
Большинство СТЗ обычно работает в циклическом режиме, решая такие задачи, как сравнение контролируемых образцов с эталоном, выявление визуальных дефектов, классификация, сортировка [211].
Благодаря повышению производительности компьютеров всё более широкое применение получают СТЗ, работающие в реальном масштабе времени [233],которые обрабатывают поступающие видеоизображения непрерывно и характеризуются жестким ограничением на время обработки кадра изображения.Чтобы уменьшить объем обрабатываемой информации в СТЗ в некоторых
случаях исходное растровое изображение преобразуется в векторное, что сокращает необходимые вычислительные ресурсы и делает процесс распознавания более гибким [62]. При этом, преобразование исходного изображения проводится в следующем порядке:
• предварительная фильтрация и бинаризация исходного изображения [44];
• аппроксимация бинарного изображения с помощью прямых и кривых второго порядка;
• удаление дефектов преобразования в векторную форму.
Возможным применением данных алгоритмов является и распознавание объемных образов путем использования базы данных (БД) эталонных образов. В БД хранятся типы объектов в соответствии с числом граней и ребер в них, а также символические правила определения ориентации, которые представляют собой отношения между геометрическими параметрами образа и текущим положением телекамеры. Эти отношения позволяют с помощью стереометрических зависимостей найти ориентацию объекта относительно робота. Расстояние до объектов можно определить геометрически по разнице смещения их изображений, полученных стереокамерами. Однако данный метод требует мощных процессоров и плохо работает в реальном времени. Распознавание образов с использованием инвариантных параметров широко используется в СТЗ и прикладных задачах мобильной робототехники [265].
Трехмерные образы предметов могут обрабатываться также посредством ЗЭ-матрицы с использованием статистической корреляционной функции.
При совпадении трехмерного образа с объектом по форме, происходит всплеск корреляционной функции.Подобно некоторым насекомым MP должны быть способны использовать визуальное наведение для поиска цели заданной массивом локально видимых ориентиров по их местоположению относительно цели [234]. В работе [224] создана численная имитационная модель навигации пчелы в полете, которая позволяет найти конечную точку путем сравнения сохраненного образа с образом, наблюдаемым в данный момент. Разница двух образов позволяет вычислить направление движения, при котором минимизировалось бы рассогласование между базовой и текущей конфигурацией ориентиров в образах. Аналогичные простые формы визуального наведения были реализованы в ряде робототехнических систем. Причина популярности такого метода навигации заключается в том, что здесь не требуется создавать сложные модели окружающего пространства для нахождения 61
ничем не выделяющейся навигационной цели (в которой ориентиры могут отсутствовать). Установление соответствия между базовым и текущим образами является фундаментальной проблемой при практической реализации функции наведения[267], [327].Имеющиеся в настоящий момент результаты исследований при реализации функции наведения в основном отличаются друг от друга по методике установления соответствия между двумя образами локальной сцены.
В работе [340] описан робот с синхронным приводом, который поддерживал практически постоянную ориентацию во время движения. Вращающийся светочувствительный элемент позволял роботу записывать одномерные полутоновые сигнатуры точек пространства, которые использовались в качестве образов, ориентированных относительно глобального направления. Тем не менее, такая система была подвержена медленному накоплению ошибки по ориентации из-за проскальзывания колес платформы робота. Степень соответствия между базовым и текущим образом определялась с использованием нейронной сети Кохонена. В работе [323] реализована данная модель наведения на роботе «Сахабот 2», оборудованном камерой с коническим зеркалом.
Обработанные образы ориентировались относительно направления на Солнце, определяемого системой ориентации с использованием поляризованного света. Эксперименты показали, что робот может достичь навигационной цели с высокой степенью точности, с условием, что РП позволяет выполнить надежное выделение ориентиров в получаемых образах. Но остается неясной эффективность данной навигационной схемы в РП без ярко выраженных ориентиров.В работе [257] проанализированы вычислительные основы методов наведения с использованием виртуальных образов и получены доказательства сходимости и нормы ошибок для этого метода. На основании математического анализа разработана модель функции наведения, альтернативная модели Картрайта и Колета [224].Вместо определения локальных совпадений образов, использован набор шаблонов для формирования общего поля совпадений на основе упрощающих предположений. Каждый шаблон совпадений использовался для создания виртуального образа на основе сохраненного базового образа, который сравнивался с текущим образом. Циклическая процедура перебирала все имеющиеся шаблоны и выбирала из них наиболее близкий к текущему образу, по которому определялось и направление движения. Аналогично методу Рофера [340],предложенный алгоритм использовал ^сегментированные полутоновые образы и не требовал выравнивания образов относительно неко
торого глобального направления. В то же время, ограниченный набор шаблонов и сделанные предположения сузили область захвата цели открытым пространством в районе базового снимка.
В статье [26] рассмотрена задача определения параметров сдвига и поворота базового кадра СТЗ мобильного робота относительно текущего кадра в реальном масштабе времени при его движении. C использованием пошаговой процедуры из исходного черно-белого полутонового изображения производится предварительное выделение набора описывающих оба кадра линий, с последующим анализом совокупности их параметров. В отличие от традиционного корреляционного подхода, предложенный метод обладает значительно большей производительностью и нечувствительностью к колебаниям яркости фрагментов изображения, а также устойчивостью к различным типам искажений кадра.
Для решения задач сопоставления ориентиров на базовом и текущем изображениях, кроме метода кросскорреляции и его модификаций, были предложены некоторые другие методы [216, 229, 261, 346, 387]. В [261, 346] сопоставление базового и текущего изображений выполняется совместно с поиском параметров преобразования между ними, используя оптимизационные методики минимизирующие целевую функцию, задаваемую в виде двух компонент: энергии деформации при отображении одного изображения в другое, полученной на основе упругой модели (конечные элементы) и критерия схожести двух изображений, полученного на основе кросскорреляционной функции.
В работе [229] предлагается метод нахождения соответствия между моделью (базовым изображением) и сценой (текущим изображением) на основе вероятностного анализа структурного соответствия (взаимного расположения характерных элементов в сравниваемых изображениях). В работе [261] выполняется также вероятностный байесовский анализ для нахождения наиболее подходящего преобразования координат базового и текущего изображений на основе вероятностной модели, построенной на основе обучающей выборки.
Программа обработки изображений в реальном времени персонального мобильного робота ERl входные видеоданные сравнивает с набором хранящихся в памяти эталонов со скоростью 5 кадр/сек, благодаря чему робот быстро реагирует на изменения во внешней обстановке, выполняет ряд осмысленных действий [38]. Персональный робот следующего поколения ER-2 оснащен вебкамерой, одометрами и использует метод визуальной навигации VSLAM (visual simultaneous localization and mapping — одновременная визуальная локализация и ориентирование). При первичном обходе по маршруту робот создаёт для себя
карту местности, определяя вехи, по которым потом будет ориентироваться. При перестановке предметов, робот перестраивает созданную ранее карту. Для ориентирования на местности робот использует карту, составленную из массива снимков окружающей обстановки и значений расстояний, измеренных одометром, сопоставляя изменение показаний цифровой камеры с пройденным расстоянием.
Для исключения столкновений с препятствиями MP оснащен дополнительными ультразвуковыми датчиками.Специализированный чип СТЗ небольшого автономного самолета (компания «Centeye»)реализуя алгоритмы нейронных сетей, выполняет промежуточную интеллектуальную обработку потока видеоданных. Благодаря этому, бортовая система получает уже готовые распознанные образы, передача которых требует пропускной способности всего в несколько килобайтов в секунду.
В MP с СТЗ при дистанционном управлении большую роль играют процессы передачи видеоинформации в цифровых каналах управления. В качестве физического канала передачи данных экономически приемлемым вариантом является использование радиоканала на основе стандартных компонент [8]. К настоящему времени лидирующие позиции по количеству практических реализаций занимает группа базовых стандартов IEEE 802.11, определяющая протоколы, необходимые для организации беспроводных локальных сетей (WLAN). Так как минимальная требуемая пропускная способность видеоканала должна быть около 160 Мбит/сек [41], используется сжатие видеоданных, в частности с применением перспективной вейвлет-технологии [9, 40]. В настоящее время фирма Analog Devicesразработала и выпустила на рынок семейство микросхем с аппаратной реализацией этого способа сжатия (до 7500 раз).
Применение стека протоколов TCP/IP на сетевом уровне (в соответствии с моделью OSI [88]) вычислительных сетей различного масштаба (от CAN и LAN до WAN) привело к появлению глобальных ІР-сетей [178]. Это сделало возможным использование ІР-сетей для информационного обмена между встраиваемыми системами и появлению таких понятий как Встроенный Интернет и Распределенные информацион- но-управляющие системы на основе IP-сети (или ІР-РИУС) [42, 320]. Ряд реализованных экспериментальных систем мобильных роботов убедительно показал перспективность применения беспроводных ІР-сетей для таких приложений.
1.5.3.