4.3. Оценка качества алгоритма идентификации состояния сцены на основе энтропийого критерия
Как было отмечено выше, задача обнаружения объекта-«цели» на тепло-визионном изображении состоит в принятии решения об отнесении участка
сигнала Р(х,у), накрытого апертурой SA, к целевому классу кт.
Класс кт является элементом множества К = {&,,/'= 1...N(C)}, причем остальные классыотносятся к нецелевым. Также выше были введены понятия верного и ошибочного исхода алгоритмов.
События, соответствующие верному обнаружению «цели» и пропуску «цели», составляют полную группу событий, т.е.:
р(кт\кт)+р(кв\кг)^\, (4.39)
где /?(.) - вероятность возникновения обозначенного исхода.
В случае, когда общее количество классов ЛГ(С)>2, т.е. количество нецелевых классов Nn (С) > 1,
р(кт\кт)+ ^ я(*а,1*гН' /=1
где р(кв^\кт) - вероятность отнесения сигнала к нецелевому классу kBi под
индексом / в то время, как в действительности его статистика описывается па-раметрами, соответствующими целевому классу кт.
То же самое для группы событий, состоящей из верного обнаружения «фона» и ложной тревоги (в случае, когда анализируемый сигнал является «фоном»),
р(кв\кв)+р(кт\кв) = \ (4.41)
Для случая, когда NB (С) > 1, возможен исход, заключающийся в принятии решения kBi\kBj (ij = \...Nn(C),i*j), вероятность которого равна
лг/?(с) Л'я(с-)
S X P[kHj\kHj)- Тогда совокупная вероятность исходов при принятии
,•=1 y=|,/*f
решения в случае, когда реализация сигнала относится к нецелевому классу:
I S р{кт I I = (4.42)
/=1 f=l /=1 j=\,j*i
Степень эффективность алгоритма, который используется при вынесении решения о принадлежности анализируемого участка сигнала тому или иному классу, определяется величиной вероятностей р(кт 1^) и р(кв\ки). Близость
этих вероятностей к единице позволяет сделать вывод об эффективности того или иного алгоритма принятия решения о принадлежности анализируемого участка сигнала Г(х,у), накрытого апертурой SA, к целевому классу.
Исходы, заключающиеся в верной идентификации целевого сигнала кт \кт и нецелевого - кв\кв, можно объединить в группу событий, обеспечив-ших верное решение задачи идентификации состояния наблюдаемой сцены. К ошибочным относятся исходы, противоположные указанным выше: пропуск «цели» (кт | кв) и «ложная тревога» {кт |кв).
Процедура оценки эффективности работы системы определения состояния пространственной сцены заключается в последовательном предъявлении системе сигналов, про которые заранее известно, являются ли они реализациями с параметрами распределения целевого класса, или же относятся к классам нецелевым. При этом априорные вероятности появления целевого сигнала
р(Т) и нецелевого - р(В)= ^ Р\квл образуют также полную группу собы-
тий, т.е.
р(кт) + р(ки) = 1 (4.43)
Оценку эффективности работы того или иного алгоритма целесообразно проводить с использованием универсального показателя, характеризующего степень неопределенности при принятии решения - энтропии.
До начала обработки, предусмотренной анализируемым алгоритмом, энтропия составляет
N(C)
"о = -LP(ki)MpM)> <4-44)
1=1
где p(k,) - априорная вероятность появления класса кг Величина Я0 примет максимальное значение, когда
я(*,)=|/л(с), (4.45)
т.е. вероятность появления каждого класса одинакова.
Здесь и далее, при определении энтропии будут рассматриваться натуральные логарифмы с основанием е, т.к. логарифмы с принятым для подобных случаев основанием 2 легко могут быть получены из указанных путем умножения их на коэффициент log2 е.
Для упрощения обозначений выделим множества классов К = |/= 1...Л'(С.')} целевой класс кт, а все нецелевые классы объединим в один класс кь. При использовании такого обобщения априорные вероятности появления классов составят:
р(кт) = р(ки) = \/2. (4.46)
Показателем эффективности алгоритма принятия решения является величина энтропии АН, на которую снижается неопределенность при использовании анализируемого алгоритма. Искомая величина АН вычисляется по формуле:
АН = Н0-НА, (4.47)
где Нл - степень неопределенности, сохранившаяся после выполнения алгоритма.
Величина НА определяется через вероятности верного и ошибочных исходов следующим образом:
На = ~РА Мрл)~ЧА *,п(Чл)> (4-48)
где рА и (}л - вероятности верного и ошибочного исходов работы алгоритма соответственно.
Как было отмечено выше, верным считается исход кт\кт и кв\кв, отсюда вероятность его появления составит (4.49)
(4.50)
PA=Hp{ki\ki)-Р(кд> i
а вероятность ошибочного исхода
Ял= X P{ki\kj\P(ki)> где i,j = {B,T}.
С учетом (4.45) значение начальной неопределенности будет максимальным и составит
(
(4.51)
In
1
Нп = —
N(C) [N(C)
а вероятности рА и qA будут равны
(4.52)
(4.53)
Таким образом, остаточная неопределенность составит 1
"л =
(4.54) С учетом (4.47), (4.51) и (4.54) уменьшение энтропии АН составит
{ \
1
АН =
(4-
Не)
5>(*, |*,).|п ][>(*, I*,.) + X />(*/!*,)',n I p(kAkj)
\ I
/ itJV*J Для оценки значения НА требуется вычислить значения вероятностей
p(k,\kj),iJ = {B,T}.
Рассмотрим систему обнаружения сигнала, относящегося к целевому классу, функционирование которой сводится к вынесению случайного решения о соответствии анализируемого сигнала одному классу из множества К. В этом случае значения всех элементов матрицы вероятностей
vJp{kT\kT) р^Л (456)
[р(кт\кв) р(кв\кв))
составят по 0,5. При этом ^p(kt | ki) = 1 и ^ р[к( \ к}) = 1.
/
Для такой системы обнаружения значение АН с учетом (4.55) составит АН = 0, т.е. при работе система вообще не уменьшает первоначальной неопределенности.
С другой стороны, в случае, если система классификации сигнала работает безошибочно, т.е.
(\ 0^1
Р =
0 1
то для нее согласно (4.55) г \
АН =
(4.57)
N(C)
2+ V Чйп о Ъ I p{Wj) После вычисления предела и приведения результата к значению логарифма по основанию 2 величина АН принимает значение, равное 1, т.е. алгоритм функционирования системы классификации полностью снимает первоначальную неопределенность.
Предположим, что статистика анализируемых системой сигналов определяется нормальным законом распределения [10].
Модель сигналов, таким образом, соответствует модели, введенной в [46], где основными характеристиками сигналов являются значения математического ожидания тт и ти для целевого и нецелевого класса соответственно, а также значение среднеквадратичного отклонения ае, принятое одинаковым для обоих классов.В этом случае простейшим алгоритмом функционирования системы является пороговое разделение на основе найденного ранее порога Р0 (рис. 4.1).
Таким образом, при классификации с использованием порога значения матрицы Р составят: Р =
(4.58) (т /Ь ^ Е'ьСО /=0 /ь т IV.W) Е >=ро J где и hBo(Pj) - гистограммы сигнала целевого и нецелевого классов
соответственно, Р0 - значение порога, N(0) - количество уровней квантования
анализируемых сигналов.
(4.59)
Можно выделить два крайних положения значений тв и тТ. Во-первых, это положение, когда тв и тТ находятся на расстоянии, достаточном для того, чтобы площадь перекрытия графиков плотностей распределения была минимальной. (рис. 4.6, а) Для нормальных законов распределения плотностей вероятности согласно правилу «3-х сигма» это расстояние составит
тт-тв>2-3ас. Порог Р0 в этом случае строится таким образом, что
\
("(О) /J,
i=/b /=о
Р =
EVC'b0
/-0 ' =/'o
N(Q)
L ,1»Л1'
а значение снимаемой неопределенности АН 1, т.е. в случае, когда соблюдается условие (4.59) использование порогового разделения сигналов полностью снимает начальную неопределенность и использование этого метода классификации представляется целесообразным.
Вторым характерным положением для значений тв и тТ является такое их расположение, когда 0 Р = ?/ь(/>)->0,5 IX,СО-*0'5 /}. ОД
1=0 «=Гп
Как показано выше, при таких значениях матрицы вероятностей исходов алгоритма АН -»0, и, следовательно, использование порогового разделения в данном случае неэффективно. f hB,M) rhvM ЧМ Л Р iB mT а) тв ^ 1'о тТ б) т} Рис. 4.6. Характерные положения распределений при анализе тепловизионных изображений Суммарная вероятность ошибочно исхода, как было сказано выше, зависит от ширины зоны перекрытия двух гистограмм. В случае, когда N(C.) = 2 вероятность ошибочного исхода qA работы алгоритма составит: с1л=(р(Т\В)+р(В\Т))/2 (4.61) т.о., с учетом (4.58) л'(С?Н Ял = (4.62) Если принять величину среднеквадратичного отклонения сс одинаковой для распределений hBo(P^) и то, очевидно, что значение порога Р0=(тг + тв)/2 будет сводить вероятность ошибки к минимуму. Кроме этого, го т-г при этом величины и ^ будут равны, а значит с учетом /=о ' ,=/Ь значения Р0, вероятность цА составит h ти - тТ (4.63) чл-ТАА1>)=F' i=0 где /' *(.) - нормальная функция распределения [9]. mB-mT Из таблицы значений /*"(.) видно, что при шв -тТ ->2-3(7,, значение (!л = F* ->0, а при тв -тТ -»0, а значение
<1л = р* ->0,5, mB-mT при этом АН 0. Это подтверждает неэффективность порогового разделения при выполнении неравенства (4.60). Интерес представляет оценка величины снимаемой неопределенности АН для рассмотренного выше метода классификации по минимуму квадратичного критерия близости (2.32) для сравнения его с той же величиной для пороговой классификации. Ч 2<*е у j M M /КЫ) /(Ф»М) Фа- (A) M"«>)]
Рис. 4.7. Статистика для квадратичного критерия близосш гистограмм Ввиду случайности значений элементов гистограммы наблюдаемого сигнала, величины критериев Фд будут также содержать элемент случайности. Это означает, что вероятностные характеристики рассматриваемого метода будут зависеть от распределений /(^(fy))) и ^'(^(ty))) (Рис-4Наличие ненулевых вероятностей ошибочных исходов обуславливается наличием «зоны перекрытия» функций плотностей распределения /(^(fyt))) и -^(^(fy)))' «Зоной перекрытия» считается такая зона, в которой значение вероятности /?(Фа'(/^))>Ф4/\/))) пРи Условии' 11X0 анализируемый сигнал относится к классу к, является ненулевым. Итак, исход является ошибочным в случае, когда при условии, что исследуемый сигнал относится к классу к. Т.о. р{кв 1*7-)= /?(фг(^г))>Ф*Ы)); (4.64) р{кт IкВ )¦= ('h(D))>ФГ (V)))' где h^ - гистограмма реализации сигнала, принадлежащего классу к. Для того, чтобы найти вероятность (fyt)) >c^Jt(ty))) необхо димо рассмотреть какие факгоры влияют на выполнение неравенства ФА. Ф;. J. Это неравенство будет выполняться в случае, когда выполняется система неравенств: Ф4Л(/))<Ф°; ф*(Л(А-)) = фо> т.е. />(Ф* (/'(А))> Ф* М) = (/V))< Фо)' Р(Ф* Ы) = Фо)'УФС (4 65) Согласно свойствам функции плотности распределения вероятности ф() я(ф,(/;(/))<Ф0)= |/(ф,(/?(у)))с1Ф; —ОО р(ф4.(л(,))=ф0)=/(ф<.(л(4))аф. С учетом того, что Ф0 е(-ад;оо) окончательное выражение для qA примет вид:
(4.66) <7Л=/?(фа(Л(А))>ф4/;(/))) = ~ / / и с!Ф I /(«^„ну -00 —оо
Исследования показывают, что при достаточно большом количестве вычислений величин и фа (''(/)) РаспРсДеление плотности их вероятно-стей может быть аппроксимировано нормальным распределением. Значение интеграла в (4.66) зависит от разности M^.^/^jj-M^^^^Jj, которая с учетом (4.6) и (4.11) составляет
1-ехр (4.67) "h~mk 2ст с /
ЧМ^Ь'ЬЫ]
' ч м[фк(/{1))]-м[ Ф,^)] т,-тк 6-ае
Рис. 4.8. График зависимости (4.67) График зависимости (4.67) представлен на рис. 4.8. На графике видно, что
1 . Иными .Л он имеет горизонтальную асимптоту, расположенную на уровне
словами, максимальная разность между значениями математических ожидании
1 (4.6) и (4.11) составляет . Это объясняется тем, что при пц - тк > 6сте
-=0 —00 при указанном условии будет постоянным и составит Критерий (./(/)] представляет собой некоторую оценку, построенную по выборке одинаково распределенных случайных величин. Т.к. объем выборки ограничен, он так же является случайной величиной, но в соответствии с законом больших чисел степень его случайности должна быть меньше случайности элементов исходной выборки. Следовательно, степень случайности значения рассматриваемого критерия (2.32) будет меньше, по сравнению со степенью случайности отдельных его составляющих. Кроме того, рис. 4.8 показывает, что (рис. 4.6, a) fi(l')-fk(P)-*О ПРИ любом Р и, следовательно, значение инте- Тала }(/,(/>)-.4(/>))2= }[/(2(/')+Л2(^)]«"> знамение разности ^j^A-(/(/)(/(*))J Растет быстрее, чем значение nil - тк. Отсюда следует, что площадь зоны перекрытия функций плотностей распределения /(ФА-('?(А))) и (fy))) уменьшается быстрее, чем площадь перекрытия функций j)(P) и fk(P) при увеличении разности Исходя из сказанного выше соответственно уменьшается значение интеграла (4.66). Это происходит за счет того, что
Ф*Ы I /МУ^М -»0 при любых (/(*))» близких к
—<0
м Фк ^ JJ, а так же JJ -> 0 при любых при любых Фк |J, близ ких к (./(/))]• Т.о. уменьшается qA при использовании алгоритма клас сификации, основанного на выражении (2.32). Как следствие энтропийная оценка Д# будет выше по сравнению с алгоритмом, основанном на пороговом разделении классов.