2.5. Оценка ширины интервала изменения гистограммы
Можно показать, что при рассмотрении некоррелированных сигналов, или использовании достаточно больших апертур распределение A(/j) является биномиальным [19]. Докажем это утверждение.
Для этого рассмотрим процесс формирования величины Л(/}) при непосредственной обработке сигнала. Анализ у-го отсчёта сигнала фактически представляет собой опыт с парой возможных случайных исходов. Обозначим исход опыта как e)j при попадании значения наблюдаемого сигнала в /'-ый уровень квантования, т.е. при /^Л/ = {'v/o,-^/i}) = и как 6>? ~ ПРИ непопалании, т.е. при p{r\j = {jcy0»>'i/i})5t Вероятность первого исхода = p(tf) обозначим как р). Поскольку с1 и образуют полную группу событий, то веро-ятность второго исхода будет равнаp\cfj j = \- p(Pj) = pf.
Множество отсчётов сигналасформированное для конкретной реализации сигнала и конкретного расположения апертуры, в этом случае можно интерпретировать как серию из Л'(Л) опытов, имеющую один из возможных исходов: 5/0 = 4 4 • - C\N[A)-2) 5/1 = 5/2 = 0
<-70 ei(N(A)-iy 5/3 = 4 s - J
i^'M-l)" е'° "я - ei(N(A)-2)
Если рассматривать еу как независимые, некоррелированные события,
то вероятности появления серий будут определяться соответствующими произ-ведениями вероятностей отдельных событий: />(«ю) = Р?- р?- «о
•"'Pi pf- р? ¦р? ••••Р? ¦р1 = p(Sn)= „о
Pi ¦р? J
-¦•'Pi • «о
Pi = pfah Ро •Ро J
•••¦ Pi ¦ J
Pi = \
и
p?f{A)ph 0"(А) 1.
(я!)2;
N{A)
И
= Pi' />,¦¦¦¦¦/>, ' Pi = По аналогии с булевыми векторами будем называть весом серии % число равное количеству событий с1 в этой серии. Из этого определе
ния, очевидно, следует выполнение неравенства 0 ? w(Sj%
Разобьём множество возможных исходов серий опытов {%} на A'(/j) + l подмножество - группы серий {Оц},1 = 0,...iN(A)> элементы которых имеют равный вес. То есть для всех Sj^ е Оц справедливо равенство ) = /.
Кроме того, вероятность появления любой серии S^, принадлежащей группе G//, будет равнаЧисло серий, относящихся к / -ой группе, устанавливается из комбина-торных соображений и равно числу сочетаний (щ^ = Л^(Л)|Д/!(//(/1)-/)!).
Таким образом, суммарная вероятность всех серий, принадлежащих группе G//,
и определяющая, соответственно, вероятность появления серии с весом, равным /, описывается выражением:
Элемент Л(//) гистограммы И, построенный по N(A) отсчётам множества
{^(^у)} 11 явля,°Щийся частотой появления отсчётов со значением Pj в этом
множестве, представляет собой дискретную случайную величину, принимаю-щую одно из множества значений {//У^(Л)},/ = 0,...,Аг(^).
Вес серии, отнесённый к её длине, имеет размерность частоты появления отсчёта Pj, при этом р(Оц) представляет собой ни что иное, как искомый
ряд распределения вероятностей p(h(Pj) = l/N(A)),l = 0,...,N(A), т.е.
Ь)|(4мГн
Для этого ряда, в частности, выполняется условие:
N{A)
I p(h(l))~l/N(A)) = 1. (2.36)
/=0
Справедливость последнего выражения устанавливается прямым сравнением (2.36) с биномом Ньютона:
+ icy"'//. (2.37)
/=0
Если в выражении (2.34) обозначить p)=b, a|l-/?J| = я, то выражение (2.36) в соответствии с (2.37) примет вид:
io p(Kpi)=l/N(A))=({i-Pi)+Pi)
Таким образом, первоначальное утверждение о характере ряда распре-деления h(Pj) справедливо.
В отличие от схемы Бернулли при анализе гистограмм интерес представляют не абсолютные числа положительных исходов, а их относительные
частоты ^(Л). При этом несколько модифицируются выражения для
математического ожидания и дисперсии D[h(//)]•
В частности, математическое ожидание найденного ряда распределения будет равно
N(A) J
Лф№)]= I ljn\P(h(Pi) = l/NA) = Pl (2.38)
/=0 N\A)
Доказательство утверждения можно выполнить методом математической индукции. При jV(Ј) = 1 справедливость выражения (2.38) определяется прямой подстановкой:
Предположим, выражение (2.38) справедливо при N(A) = n.
Докажем, что оно будет также справедливо при Л' (А) = п +1:Первое слагаемое (при / = 0) суммы (2.39) равно нулю, поэтому его можно исключить из рассмотрения. В этом случае (2.39) преобразуется к виду:
Перепишем последнюю сумму, обозначив 1-\ = т и заменив соответствующим образом параметр и пределы суммирования:
ч.т.д.
Дисперсия ряда распределения {/;(//(/} ) = //N(,4))J, рассматриваемого для заданного N (А), определяется выражением: фу .-> I ,
(2.40)
1=0 {Ь
1 J 1. Доказательство этого утверждения осуществляется аналогично доказательству выражения (2.38).
р(ЦГ1).11ЩЛ))
Рис. 2.14. Распределение отдельных элементов гистограммы
Зависимости (2.35), (2.38) и (2.40) позволяют определить диапазон, в который будут попадать оценки плотности распределения //>(/') по гистограмме
Н для заданного объема выборки и априорных вероятностей появления значений сигнала. На рис. 2.14 показан пример разброса оценок при нормальном распределении //>(/').
Таким образом, при ограниченном размере апертуры значения элементов гистограммы h(l)) распределены биномиально, при этом их математическое ожидание равно априорной вероятности появления в сигнале отсчётов со значением //, т.е. М [/?(/',)] = р{У,)- Дисперсия элементов h(l]) убывает с ростом объёма выборки N(/1), т.е. увеличение размеров апертуры делает оценку ряда /?(/]) по гистограмме статистически более обоснованной. Найденные зависи-мости позволяют определить целесообразность использования гистограммных оценок при решении задачи распознавания.