<<
>>

Наведение путем сопоставления базового и текущего изображений, распознавание сложных образов и сцен

Большинство СТЗ обычно работает в циклическом режиме, решая такие за­дачи, как сравнение контролируемых образцов с эталоном, выявление визуаль­ных дефектов, классификация, сортировка [211].

Благодаря повышению произ­водительности компьютеров всё более широкое применение получают СТЗ, работающие в реальном масштабе времени [233],которые обрабатывают по­ступающие видеоизображения непрерывно и характеризуются жестким ограни­чением на время обработки кадра изображения.

Чтобы уменьшить объем обрабатываемой информации в СТЗ в некоторых

случаях исходное растровое изображение преобразуется в векторное, что со­кращает необходимые вычислительные ресурсы и делает процесс распознава­ния более гибким [62]. При этом, преобразование исходного изображения про­водится в следующем порядке:

• предварительная фильтрация и бинаризация исходного изображения [44];

• аппроксимация бинарного изображения с помощью прямых и кривых второ­го порядка;

• удаление дефектов преобразования в векторную форму.

Возможным применением данных алгоритмов является и распознавание объемных образов путем использования базы данных (БД) эталонных образов. В БД хранятся типы объектов в соответствии с числом граней и ребер в них, а также символические правила определения ориентации, которые представляют собой отношения между геометрическими параметрами образа и текущим по­ложением телекамеры. Эти отношения позволяют с помощью стереометриче­ских зависимостей найти ориентацию объекта относительно робота. Расстояние до объектов можно определить геометрически по разнице смещения их изо­бражений, полученных стереокамерами. Однако данный метод требует мощных процессоров и плохо работает в реальном времени. Распознавание образов с использованием инвариантных параметров широко используется в СТЗ и при­кладных задачах мобильной робототехники [265].

Трехмерные образы предметов могут обрабатываться также посредством ЗЭ-матрицы с использованием статистической корреляционной функции.

При совпадении трехмерного образа с объектом по форме, происходит всплеск кор­реляционной функции.

Подобно некоторым насекомым MP должны быть способны использо­вать визуальное наведение для поиска цели заданной массивом локально видимых ориентиров по их местоположению относительно цели [234]. В работе [224] создана численная имитационная модель навигации пчелы в полете, которая позволяет найти конечную точку путем сравнения сохра­ненного образа с образом, наблюдаемым в данный момент. Разница двух образов позволяет вычислить направление движения, при котором миними­зировалось бы рассогласование между базовой и текущей конфигурацией ориентиров в образах. Аналогичные простые формы визуального наведения были реализованы в ряде робототехнических систем. Причина популярно­сти такого метода навигации заключается в том, что здесь не требуется создавать сложные модели окружающего пространства для нахождения 61

ничем не выделяющейся навигационной цели (в которой ориентиры могут отсутствовать). Установление соответствия между базовым и текущим образами является фундаментальной проблемой при практической реали­зации функции наведения[267], [327].Имеющиеся в настоящий момент ре­зультаты исследований при реализации функции наведения в основном от­личаются друг от друга по методике установления соответствия между дву­мя образами локальной сцены.

В работе [340] описан робот с синхронным приводом, который поддержи­вал практически постоянную ориентацию во время движения. Вращающийся светочувствительный элемент позволял роботу записывать одномерные полу­тоновые сигнатуры точек пространства, которые использовались в качестве об­разов, ориентированных относительно глобального направления. Тем не менее, такая система была подвержена медленному накоплению ошибки по ориента­ции из-за проскальзывания колес платформы робота. Степень соответствия ме­жду базовым и текущим образом определялась с использованием нейронной сети Кохонена. В работе [323] реализована данная модель наведения на роботе «Сахабот 2», оборудованном камерой с коническим зеркалом.

Обработанные образы ориентировались относительно направления на Солнце, определяемого системой ориентации с использованием поляризованного света. Эксперименты показали, что робот может достичь навигационной цели с высокой степенью точности, с условием, что РП позволяет выполнить надежное выделение ориен­тиров в получаемых образах. Но остается неясной эффективность данной на­вигационной схемы в РП без ярко выраженных ориентиров.

В работе [257] проанализированы вычислительные основы методов наведе­ния с использованием виртуальных образов и получены доказательства сходи­мости и нормы ошибок для этого метода. На основании математического ана­лиза разработана модель функции наведения, альтернативная модели Кар­трайта и Колета [224].Вместо определения локальных совпадений образов, использован набор шаблонов для формирования общего поля совпадений на основе упрощающих предположений. Каждый шаблон совпадений использо­вался для создания виртуального образа на основе сохраненного базового об­раза, который сравнивался с текущим образом. Циклическая процедура переби­рала все имеющиеся шаблоны и выбирала из них наиболее близкий к текущему образу, по которому определялось и направление движения. Аналогично мето­ду Рофера [340],предложенный алгоритм использовал ^сегментированные полутоновые образы и не требовал выравнивания образов относительно неко­

торого глобального направления. В то же время, ограниченный набор шабло­нов и сделанные предположения сузили область захвата цели открытым про­странством в районе базового снимка.

В статье [26] рассмотрена задача определения параметров сдвига и поворо­та базового кадра СТЗ мобильного робота относительно текущего кадра в ре­альном масштабе времени при его движении. C использованием пошаговой процедуры из исходного черно-белого полутонового изображения производит­ся предварительное выделение набора описывающих оба кадра линий, с после­дующим анализом совокупности их параметров. В отличие от традиционного корреляционного подхода, предложенный метод обладает значительно большей производительностью и нечувствительностью к колебаниям яркости фрагмен­тов изображения, а также устойчивостью к различным типам искажений кадра.

Для решения задач сопоставления ориентиров на базовом и текущем изо­бражениях, кроме метода кросскорреляции и его модификаций, были предло­жены некоторые другие методы [216, 229, 261, 346, 387]. В [261, 346] сопостав­ление базового и текущего изображений выполняется совместно с поиском па­раметров преобразования между ними, используя оптимизационные методики минимизирующие целевую функцию, задаваемую в виде двух компонент: энер­гии деформации при отображении одного изображения в другое, полученной на основе упругой модели (конечные элементы) и критерия схожести двух изо­бражений, полученного на основе кросскорреляционной функции.

В работе [229] предлагается метод нахождения соответствия между моде­лью (базовым изображением) и сценой (текущим изображением) на основе ве­роятностного анализа структурного соответствия (взаимного расположения ха­рактерных элементов в сравниваемых изображениях). В работе [261] выполня­ется также вероятностный байесовский анализ для нахождения наиболее под­ходящего преобразования координат базового и текущего изображений на ос­нове вероятностной модели, построенной на основе обучающей выборки.

Программа обработки изображений в реальном времени персонального мо­бильного робота ERl входные видеоданные сравнивает с набором хранящихся в памяти эталонов со скоростью 5 кадр/сек, благодаря чему робот быстро реа­гирует на изменения во внешней обстановке, выполняет ряд осмысленных дей­ствий [38]. Персональный робот следующего поколения ER-2 оснащен веб­камерой, одометрами и использует метод визуальной навигации VSLAM (visual simultaneous localization and mapping — одновременная визуальная локализация и ориентирование). При первичном обходе по маршруту робот создаёт для себя

карту местности, определяя вехи, по которым потом будет ориентироваться. При перестановке предметов, робот перестраивает созданную ранее карту. Для ориентирования на местности робот использует карту, составленную из масси­ва снимков окружающей обстановки и значений расстояний, измеренных одо­метром, сопоставляя изменение показаний цифровой камеры с пройденным расстоянием.

Для исключения столкновений с препятствиями MP оснащен до­полнительными ультразвуковыми датчиками.

Специализированный чип СТЗ небольшого автономного самолета (компа­ния «Centeye»)реализуя алгоритмы нейронных сетей, выполняет промежуточ­ную интеллектуальную обработку потока видеоданных. Благодаря этому, бор­товая система получает уже готовые распознанные образы, передача которых требует пропускной способности всего в несколько килобайтов в секунду.

В MP с СТЗ при дистанционном управлении большую роль играют процес­сы передачи видеоинформации в цифровых каналах управления. В качестве фи­зического канала передачи данных экономически приемлемым вариантом явля­ется использование радиоканала на основе стандартных компонент [8]. К на­стоящему времени лидирующие позиции по количеству практических реализа­ций занимает группа базовых стандартов IEEE 802.11, определяющая протоко­лы, необходимые для организации беспроводных локальных сетей (WLAN). Так как минимальная требуемая пропускная способность видеоканала должна быть около 160 Мбит/сек [41], используется сжатие видеоданных, в частности с применением перспективной вейвлет-технологии [9, 40]. В настоящее время фирма Analog Devicesразработала и выпустила на рынок семейство микросхем с аппаратной реализацией этого способа сжатия (до 7500 раз).

Применение стека протоколов TCP/IP на сетевом уровне (в соответствии с моде­лью OSI [88]) вычислительных сетей различного масштаба (от CAN и LAN до WAN) привело к появлению глобальных ІР-сетей [178]. Это сделало возможным использо­вание ІР-сетей для информационного обмена между встраиваемыми системами и по­явлению таких понятий как Встроенный Интернет и Распределенные информацион- но-управляющие системы на основе IP-сети (или ІР-РИУС) [42, 320]. Ряд реализо­ванных экспериментальных систем мобильных роботов убедительно показал пер­спективность применения беспроводных ІР-сетей для таких приложений.

1.5.3.

<< | >>
Источник: ЛУКЬЯНОВ АНДРЕЙ АНАТОЛЬЕВИЧ. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ПРОБЛЕМЕ ОБЕСПЕЧЕНИЯ ТОЧНОСТИ ДВИЖЕНИЯ И ПОЗИЦИОНИРОВАНИЯ МОБИЛЬНЫХ МАНИПУЛЯЦИОННЫХ РОБОТОВ. ДИССЕРТАЦИЯ на соискание ученой степени доктора технических наук. Иркутск - 2005. 2005

Еще по теме Наведение путем сопоставления базового и текущего изображений, распознавание сложных образов и сцен: