Техническое зрение роботов

и для одной переменной. Пусть, например, даны три 16-уровневых изображения, соответствующие КЗГ компонентам датчика цвета. Сформируем кубическую решетку 16х16х16 и поместим в каждый элемент пикселы, КЗГ ком­поненты которых имеют интенсивности, соответствующие коор­динатам, определяющим положение этого элемента. Число то­чек в каждом элементе решетки может быть затем разделено на общее число пикселов образа для формирования нормированной гистограммы.

Теперь выбор порога заключается в нахождении групп точек в трехмерном пространстве, где каждая «компактная» группа аналогична основной моде гистограммы одной переменной. На­пример, предположим, что мы ищем две значимые группы точек данной гистограммы, где одна группа соответствует объекту, а другая—фону. Принимая во внимание, что теперь каждый пик­сел имеет три компоненты и может быть рассмотрен как точка трехмерного пространства, можно сегментировать образ с по­мощью следующей процедуры. Для каждого пиксела образа вычисляется расстояние между этим пикселом и центром каж­дой группы. Тогда, если пиксел располагается рядом с центром группы точек объекта, мы помечаем его 1; в противном случае мы помечаем его 0. Это понятие легко распространить на боль­шую часть компонентов пиксела и соответственно на большую часть групп. Основная сложность состоит в том, что определение значимых групп, как правило, приводит к довольно сложной задаче, поскольку число переменных возрастает.

2.3.Областно-ориентированная сегментация

2.3.1.Основные определения.

Целью сегментации является разде­ление образа на области. Рассмотрим методы сегмен­тации, основанные на прямом нахождении областей.

ПустьR область образа. Рассмотрим сегментацию как процесс разбиения R на n подобластейR1, R2, ..., Rn, так что

1.

2. Pi — связная область, i= 1, 2, ..., п,

3.Ri Ri = для всехi и j, i j,

4.P(Ri) есть ИСТИНА дляi= 1, 2, ..., n;

5.P( Ri U Ri ) есть ЛОЖЬ дляi j, где P(Ri)— логический предикат, определенный на точках из множества Ri, и -пу­стое множество.

Условие 1 означает, что сегментация должна быть полной, т. е. каждый пиксел должен находиться в образе. Второе усло­вие требует, чтобы точки в области были связными. Условие 3 указывает на то, что области не должны пересекать­ся. Условие 4 определяет свойства, которым должны удовлетво­рять пикселы в сегментированной области. Простой пример: Р (Ri) = ИСТИНА, если все пикселы вRi имеют одинаковую интенсивность. Условие 5 означает, что области Ri и Ri разли­чаются по предикату Р.

2.3.2.Расширение области за счет объединения пикселов.

Расшире­ние области сводится к процедуре группирования пикселов или подобластей в большие объединения. Простейшей из них яв­ ляется агрегирование пикселов. Процесс начинается с выбора множества узловых точек, с которых происходит расширение области в результате присоединения к узловым точкам сосед­них пикселов с похожими характеристиками (интенсивность, текстура или цвет). Пусть цифры внутри ячеек указывают интенсивность. Пусть точки с координатами (3, 2) и (3, 4) используются как узловые. Выбор двух начальных точек приведет к сегментации образа на две области: области R1, свя­занной с узлом (3, 2), и области R2, связанной с узлом (3, 4). Свойство Р, которое мы будем использовать для того, чтобы от­нести пиксел к той или иной области, состоит в том, что модуль разности между интенсивностями пиксела и узловой точки не превышает пороговый уровень Т. Любой пиксел, удовлетворяю­щий этому свойству одновременно для обоих узлов, произвольно попадает в область Ri . В этом случае сегментация проводится для двух областей, причем точки в R1 обозначаются буквой а, точки вR 2 буквой b. Необходимо отметить, что независимо от того, в какой из этих двух областей будет взята начальная точка, окон чательный результат будет один и тот же. Если, с другой сто­роны выбрать Т = 8, была бы получена единственная область

Предыдущий пример, не­смотря на его простоту, иллю стрирует некоторые важные проблемы расширения области. Двумя очевидными проблема­ми являются: выбор началь ных узлов для правильного представления областей, представляющих интерес, и опреде­ление подходящих свойств для включения точек в различные области в процессе расшире­ния. Выбор множества, состоя­щего из одной или нескольких начальных точек, следует из по­становки задачи. Например, в военных приложениях объек­ты, представляющие интерес, имеют более высокую темпера­туру, чем фон, и поэтому про­являются более ярко. Выбор наиболее ярких пикселов явля­ется естественным начальным шагом в алгоритме процесса расширения области. При от­сутствии априорной информа­ции можно начать с вычисле­ния для каждого пиксела на­бора свойств, который навер­няка будет использован при установлении соответствия пик­села той или иной области в процессе расширения. Если ре­зультатом вычислений являют­ся группы точек (кластеры), тогда в качестве узловых бе­рутся те пикселы, свойства ко­торых близки к свойствам центроидов этих групп. Так, в примере, приведенном выше, гистограмма интенсивностей показала бы, что точки с интен­сивностью от одного до семи являются доминирующими.Выбор критерия подобия зависит не только от задачи, но также от вида имеющихся данных об образе. Например, анализинформации, полученной со спутников, существенно зависит от использования цвета. Задача анализа значительно усложнится при использовании только монохроматических образов. К сожа­лению, в промышленном техническом зрении возможность полу­чения мультиспектральных и других дополнительных данных об образе является скорее исключением, чем правилом. Обычно анализ области должен осуществляться с помощью набора дес­крипторов, включающих интенсивность и пространственные ха­ рактеристики (моменты, текстуру) одного источника изображе­ния. Отметим, что применение только одних дескрипторов может приводить к неправильным результатам, если не используется информация об условиях связи в процессе расширения области. Это легко продемонстрировать при рассмотрении случайного рас­положения пикселов с тремя различными значениями интенсив­ности. Объединение пикселов в «область» на основе признака одинаковой интенсивности без учета условий связи приведет к бессмысленному результату при сегментаци.

Другой важной проблемой при расширении области является формулировка условия окончания процесса. Обычно процесс расширения области заканчивается, если больше не существует пикселов, удовлетворяющих критерию принадлежности к той или иной области. Выше упоминались такие критерии, как интен­сивность, текстура и цвет, которые являются локальными по своей природе и не учитывают «историю» процесса расширения области. Дополнительный критерий, повышающий мощность алгоритма расширения области, включает понятие размера, схо­жести между пикселом-кандидатом и только что созданными пикселами (сравнение интенсивности кандидата и средней ин­тенсивности области), а также формы области, подлежащей расширению. Использование этих типов дескрипторов основано на предположении, что имеется неполная информация об ожи­даемых результатах.

2.3.2.Разбиение и объединение области.

Изложенная выше про­цедура расширения области начинает работу с заданного мно­жества узловых точек. Однако можно сначала разбить образ на ряд произвольных непересекающихся областей и затем объ­единять и/или разбивать эти области с целью удовлетворения условий. Итеративные алгоритмы разбиения и объединения, работа которых направле­на на выполнение этих ограничений, могут быть изложены сле­дующим образом.

ПустьR является полной областью образа, на которой опре­делен предикат Р. Один из способов сегментации R состоит в успешном разбиении площади образа на все меньшие квадрат­ные области, так что для каждой областиRi , P( Ri ) = ИСТИ НА. Процедура начинает работу с рассмотрения всей области R . Если Р( R) = ЛОЖЬ, область разбивается на квадранты. Если для какого-либо квадранта Р принимает значение ЛОЖЬ, этот квадрант разбивается на подквадранты и т. д. Этот метод разбиения обычно представляется в виде так называемого квадродерева (дерева, у которого каждая вершина имеет только че­тыре потомка). Отметим, что корень дерева соответствует всему образу,а каждая вершина - разбиению. В данном случае только R4 подлежит дальнейшему разбиению. Если применять только опе­рацию разбиения, можно ожидать, что в результате окончатель­ного разбиения всей площади образа на подобласти последние будут иметь одинаковые свойства. Это можно устранить допу­стимым объединением так же, как и разбиением. Для того чтобы удовлетворить условиям сегментации, введенным выше, необ­ходимо объединять только те соседние области, пикселы которых удовлетворяют предикату Р, таким образом, две соседние обла­стиRi иRk объединяются только в том случае, если P( Ri U Rk) = ИСТИНА.

Изложенное выше можно представить в виде процедуры, где на каждом шаге выполняются следующие операции:

1. Разбиение областиRi , для которой Р {Ri) = ЛОЖЬ, на четыре непересекающихся квадранта.

2. Объединение соседних областейRi и Rk, для которых Р (Ri U Rk ) = ИСТ ИНА.

3. Выход на останов, когда дальнейшее объединение илиразбиение невозможно.

Возможны варианты этого алгоритма. Например, можно сначала разбить образ на квадратные блоки. Дальней шее разбиение выполняется по изложенному выше способу, но вначале объединение ограничивается группами из четырех бло­ков, являющихся в квадродереве потомками и удовлетворяю­щих предикату Р. Когда дальнейшее объединение этого типа становится невозможным, процедура завершается окончател ьным объединением областей согласно шагу 2. В этом случае объединяемые области могут иметь различный размер. Основ­ным преимуществом этого подхода является использование од­ ного квадродерева для разбиения и объединения до шага, на котором происходит окончательное объединение.

2.4. Применение движения

Движение представляет собой мощное средство, которое ис­пользуется человеком и животными для выделения интересую­щих их объектов из фона. В системах технического зрения ро­ботов движение используется при выполнении различных операций на конвейере, при перемещении руки, оснащенной дат­чиком, более редко при перемещении всей робототехнической системы.

2.4.1.Основной подход.

Один из наиболее простых подходов для определения изменений между двумя кадрами изображения (образами)f(x, у, ti ) иf(x, у, t,), взятыми соответственно в моменты времени ti и t j, основывается на сравнении соответ­ствующих пикселов этих двух образов. Для этого применяется процедура, заключающаяся в формировании так называемой разности образов.

Предположим, что мы имеем эталонный образ, имеющий только стационарные компоненты. Если сравним этот образ с таким же образом, имеющим движущиеся объекты, то разность двух образов получается в результате вычеркивания стацио­нарных компонент (т. е. оставляются только ненулевые записи, которые соответствуют нестационарным компонентам изобра­жения).

Разность между двумя кадрами изображения, взятыми в мо­менты времени ti иtj, можно определить следующим образом:

dij(x,y) = (*)

где q—значение порогового уровня. Отметим, чтоdij (x, у) при­нимает значение 1 для пространственных координат (х, у) только в том случае, если два образа в точке с этими координа­тами существенно различаются по интенсивности, что опреде­ляется значением порогового уровня q.

При анализе движущегося образа все пикселы изображений разностиdij(x, у), имеющие значение 1, рассматриваются как результат движения объекта. Этот подход приметим только в том случае, если два образа зарегистрированы и освещен­ность имеет относительно постоянную величину в пределах границ, устанавливаемых пороговым уровнем q. На практике записи вdij( x, у), имеющие значение 1, часто появляются в ре­зультате действия шума. Обычно на разности двух кадров изо­бражения такие значения выглядят как изолированные точки. Для их устранения применяется простой подход, заключающийся в формировании 4- или 8-связных областей из единиц в dij(x, у), и затем пренебрегают любой областью с числом записей, мень­шим заранее заданного. При этом можно не распознать малые и/или медленно движущиеся объекты, но это увеличивает ве­роятность того, что остающиеся записи в разности двух кадров изображения действительно соответствуют движению.

2.4.2.Аккумулятивная разность.

Как говорилось выше, разность кадров благодаря шуму часто содержит изолированные записи. Несмотря на то что число таких записей может быть сокращено или полностью ликвидировано в результате анализа связности пороговых уровней, этот процесс может также привести к по­тере изображений малых или медленно движущихся о бъектов. Ниже излагается подход для решения этой проблемы путем рассмотрения изменения в расположении пикселов на несколь­ких кадрах, т. е. в процесс вводится «память». Основная идея заключается в пренебрежении теми изменениями, которые воз­никают случайно в последовательности кадров и, таким образом, могут быть отнесены к случайному шуму.

Рассмотрим последовательность кадров изображения f (x,y,t1), f(x, у, t2), ..., f( x, у, tn) и допустим, чтоf(x, у, t1) является эталонным образом. Изображение аккумулятивной разности формируется в результате сравнения эталонного об­раза с каждым образом в данной последовательности. В процедуре построения изображения аккумулятивной разности имеется счетчик, предназначенный для учета расположения пик­селов. Его значение увеличивается каждый раз, когда возникает различие в расположении соответствующих пикселов эталон­ного образа и образа из рассматриваемой последовательности. Таким образом, когдаk- й кадр сравнивается с эталонным, запись в данном пикселе аккумулятивней разности означает, во сколько раз интенсивность пиксела k-го кадра отличается от ин­тенсивности пиксела эталонного образа. Различия устанавли­ваются, например, с помощью уравнения (*).

Приведенные выше рассуждения иллюстрируются рисунке. На рисунке а —д приведены образы прямоугольного объекта (обозначенного нулями), движущегося вправо с постоянной ско­ростью 1 пиксел/кадр. Эти образы приведены в моменты вре­мени, соответствующие одному перемещению пиксела. На рис. (а ) изображен кадр эталонного образа, на рис. ( г) со 2-го по 4-й кадры последовательности, а на рис. (д)— 11-й кадр. Рис. (е— и) соответствуют изображениям аккумулятив­ной разности, которые можно объяснить следующим образом. На рис. (е) левая колонка из 1 обусловлена различием между объектом на рис. (а), и фоном на рис. (б). Правая колонка из 1 вызвана различием между фоном эталонного образа и пе­редним контуром движущегося объекта. Ко времени появления4-го кадра (рис. г), первый ненулевой столбец изображе­ния аккумулятивной разности указывает на три отсчета, что со­ответствует трем основным различиям между этим столбцом в эталонном образе и соответствующим столбцом в последующихкадрах. На рис. и показано общее число из 10 (представ­ленных «A» в шестнадцатеричной системе счисления) изменений этого положения. Остальные записи на этом рисунке объясня­ются аналогично.

Нередко полезно рассматривать три типа изображений акку­мулятивной разности: абсолютное, положительное и отрица­тельное. Последние два получаются из уравнения (*), вкотором нет модуля, а вместоf(x, у, ti ) подставляется значение эталонного кадра. Предполагая, что числовые значения интен­сивности объекта превышают значения фона в случае, когда разность положительна, она сравнивается с положительным значением порогового уровня; если отрицательна, сравнение выполняется с отрицательным значением порогового уровня. Это определение заменяется на противоположное, если интенсив­ность объекта меньше фона.

Рис. Кадр эталонного образа (а), б—д соответственно 2-, 3-, 4- и 11-й кадры, е—и— изображения аккумулятивной разности для 2-, 3-, 4- и 11-го кадров .

9
10 00000000
11 00000000
12 00000000
a 13 00000000
14 00000000
15 00000000
16
9 9
10 0000000 0 10 1 1
11 00000000 11 1 1
12 00000000 12 1 1 е
б 13 00000000 13 1 1
14 00000000 14 1 1
15 00000000 15 1 1
16 16
9 9
10 00000000 10 2 1 21
11 0000000C 11 21 21
в 12 0000000C 12 21 21 ж
13 0000000C 13 21 21
14 000 00000 14 21 21
15 00000000 15 21 21
16 16
9 9
10 00000000 10 321 321
11 00000000 11 321 321
г 12 00000000 12 321 3 21 з
13 00000000 13 321 321
14 00000000 14 321 321
15 00000000 15 321 321
16 16
9 9
10 0 0000000 10 A98 76 5438887654321
11 00000000 11 A9876 5438887654321
12 00000000 12 A9876 5438887654321
д 13 00000000 13 A9876 5438887654321 и
14 00000000 14 A9876 5438887654321
15 00000000 15 A9876 543888.7654321
16 16

2.4.3.Определение эталонного образа.

Успех применения методов зависит от эталон­ного образа, относительно которого проводятся дальнейшие сравнения. Как уже говорилось выше, различие между двумя образами в задаче распознавания движущихся объектов опре­деляется путем исключения стационарных компонент при сохра­нении элементов, соответствующих шуму и движущимся объек­там. Проблема выделения образа из шума решается методом фильтрации или с помощью формирования изображения акку­мулятивной разности.

На практике не всегда можно получить эталонный образ, имеющий только стационарные элементы, и это приводит к не­обходимости построения эталона из набора образов, содержа­щих один или более движущихся объектов. Это особенно харак­терно для ситуаций, описывающих сцены со многими быстро­меняющимися объектами или в случаях, когда возникают частые изменения сцен. Рассмотрим следующую процедуру гене­рации эталонного образа. Предположим, что мы рассматриваем первый образ последовательности в качестве эталонного. Когда нестационарная компонента полностью вышла из своего положе­ния в эталонном кадре, соответствующий фон в данном кадре может быть перенесен в положение, первоначально занимаемое объектом в эталонном кадре. Когда все движущиеся объекты полностью покинули свои первоначальные положения, в резуль­тате этой операции воссоздается эталонный образ, содержащий только стационарные компоненты. Перемещение объекта можно определить с помощью операции расширения положительного изображения аккумулятивной разности.

3.ОПИСАНИЕ

В системах технического зрения проблемой описания назы­вается выделение свойств (деталей) объекта с целью распозна­вания. В идеальном случае дескрипторы не должны зависеть от размеров, расположения и ориентации объекта, но должны содержать достаточное количество информации для надежной идентификации объектов. Описание является основным резуль­татом при конструировании систем технического зрения в том смысле, что дескрипторы должны влиять не только на слож­ность алгоритмов распознавания, но также и на их работу. рассмотрим три основные катего­рии дескрипторов: дескрипторы границы, дескрипторы области и дескрипторы для описания трехмерных структур.

3.1.Дескрипторы границы.

3.1.1.Цепные коды.

Цепные коды применяются для представления границы в виде последовательности отрезков прямых линий определенной длины и направления. Обычно в основе этого представления лежит 4- или 8-связная прямоугольная решетка. Длина каждого отрезка определяется разрешением решетки, а направления задаются выбранным кодом. Отметимчто для представления всех направлений в 4-направленном цеп­ном коде достаточно 2 бит, а для 8-направленного цепного кода требуется 3 бит. Для порождения цепного кода заданной границы сначала выбирается решетка. Тогда, если площадь ячейки, расположенной внутри границы, больше определенного числа (обычно 50%), ей присваивается значение 1; в противном слу­чае этой ячейке присваивается значение 0. Окон­чательно мы кодируем грани­цу между двумя областями, используя направления.Результат кодирования в на­правлении по часовой стрелке с началом в месте, помеченном точкой. Альтернативная процедура состоит в разбиении границы на участки равной длины (каждый участок имеет одно и то же число пикселов) и со единении граничных точек

каждого участка прямой линией, а затем присваивания каждой линии направления, ближайшего к одному из допустимых направлений цепного кода. Важно отметить, что цепной код данной границы зависит от начальной точки. Однако можно нормировать код с помощью простой процедуры. Для создания цепного кода начальная точка на решетке выбирается произвольным образом. Рассмат­ривая цепной код как замкнутую последовательность индексов направлений, мы вновь выбираем начальную точку таким обра­зом, чтобы результирующая последовательность индексов была целым числом, имеющим минимальную величину. Также можно нормировать повороты, если вместо цепного кода рассматри­вать его первую разность. Первая разность вычисляется в ре­зультате отсчитывания (в направлении против часовой стрелки)' числа направлений, разделяющих два соседних элемента кода. Например, первая разность


29-04-2015, 04:16

Страницы: 1 2 3 4
Разделы сайта