<<
>>

ПЕРВИЧНАЯ ОБРАБОТКА КОЛИЧЕСТВЕННЫХ ДАННЫХ И НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ ПРИ АНАЛИЗЕ РАСПРЕДЕЛЕНИЯ ПОЧВЕННЫХ БЕСПОЗВОНОЧНЫХ

Вариационно-статистическая обработка материала используется во всех разделах биологии, в которых исследователь имеет дело с варьирующими количественными данными. Ее главная зада­ча— сведение большого числа измерений к нескольким показа­телям, каждый из которых отражает определенную сторону исходного материала (Юл, Кендэл, 1960; Василевич, 1969).

Ме­тоды вариационной статистики используются в целях упорядо­чивания и облегчения анализа исходных данных, оценки их до­стоверности и пригодности для тех или иных математических операций. Некоторые из статистических индексов могут служить показателями определенных популяционных и ценотических от­ношений. Часто обработка материала заканчивается определе­нием средней арифметической, что соответствует лишь задачам предварительных ориентировочных оценок. Более глубокий ана­лиз количественных закономерностей популяционных отноше­ний, биоценотических связей, биотопического распределения не­избежно предполагает привлечение вариационно-статистическо­го аппарата. Вместе с тем количественные популяционно-биоце- нологические материалы обладают некоторыми специфическими особенностями, требующими большой осторожности использо­вания методов вариационной статистики.

Один из первых шагов к упорядочиванию количественных данных — составление упорядоченных рядов. Так, в процессе учета диплопод в дубраве под Курском в пробах 25x25 см на каждую пробу получено следующее число особей Turanodesmus dmitriewi (в порядке взятия проб): 2, 1, 0, 5, З, 1, 3, 2, 4, 3, 0, 6, 2, 4, 1, 2, 3, 3, 4, 3, 2, 2, 3. Этот весьма громоздкий ряд цифр

184

можно перестроить по величине чисел- 0, 0, 1, 1, 1, 2, 2, 2, 2, 2. 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 6. Это упорядоченный ряд. В нем лег ко видеть минимальные и максимальные пределы числа особей данного вида\в пробах, частоту разных величин. Для еще боль­шей наглядности его можно записать в следующем виде-

Число особей в пробе 0 1 2 3 4 5 6

Частота .........................................

2 3 6 7 З 1 1

Эти данные отражены на графике (рис. 17), на котором на оси ординат — частота, т. е. число проб с данным числом особей, на оси абсцисс — значение признака, т. е. число особей в пробе. Это так называемая гистограмма распределения частот. Если вершины столбиков соединить линией, то получим вариационную кривую, смысл которой сводится к тому, что чаще всего встре­чаются значения признака (в данном случае число особей в про­бе), наиболее близкие к средней арифметической (2, 6) нашего ряда; отклонения тем реже, чем дальше они отстоят от средней величины. Размах кривой отражает пределы варьирования при­знака (лимит или амплитуда). Пик кривой или гистограммы на­зывается модой (наиболее часто встречающийся показатель). В данном случае мода равна 3. Эта величина наряду со средней может использоваться как мера уровня признака (обилия). При­чем в ряде случаев, при очень сильных колебаниях крайних по­казателей, мода оказывается даже более удобной, чем средняя арифметическая. Иногда используется еще одна мера уровня признака — медиана. Это — показатель, располагающийся в се­редине упорядоченного ряда. В нашем ряду это также — 3. При четном числе членов ряда медиану находят как среднее арифме­тическое из двух срединных чисел. В почвенно-зоологических работах мода и медиана используются очень редко. Необходи­мо помнить, что все статистические показатели, получаемые в процессе обработки вариационных рядов (средняя арифметиче­ская, мода, медиана, ошибка средней и т. д.) должны выражать­ся в тех же единицах, что и исходные учетные данные. Если мы учитывали животных в пробах 25X25 см, то все прочие показа­тели должны относиться только к данной площади. К дальней­шим экстраполяциям на другие площади и объемы среды эти показатели уже не имеют отношения. Если при большой пов­торности мы получим гистограмму, на которой отчетливы не од­на, а две или более вершины с провалами между ними, то это может служить показателем того, что имеем дело с разными группами организмов с различными экологическими диапазо­нами, или в нишей совокупности смешаны выборки, соответ­ствующие весьма различным условиям, определяющим разный тип распределения и разные уровни численности учитываемых объектов.

При учете почвенных беспозвоночных в пробах общеприня­тых размеров мы часто сталкиваемся с таким положением, ког-

185

Рис. 17. Гистограмма рас­пределения частот Объяснение © тексте

да большинство проб содержит ми­нимальное число особей, или вовсе пусты. Гистограмма и кривая рас­пределения частот принимают вид, показанный на рис. 18. В этом слу­чае мода приходится на минималь­ное обилие в пробе и далеко отсто­ит от медианы. Такую гистограмму могут давать многие распределения (,в частности, распределения Пуас­сона). Если распределение особей случайное, то увеличивая размер пробы, мы увеличиваем среднюю, а в случае большой средней случай­ное распределение аппроксимирует­ся нормальным (Урбах, 1964). В лю­бом другом случае увеличение раз­мера проб не дает приближения к нормальному распределению.

В почвенно-зоологических иссле­дованиях определенный размер проб применяется для учета одно­временно большого числа видов и групп с разной численностью. Кроме того, размер проб часто диктуется техническими соображениями, например, при учетах в эклекторах Эти обстоятельства весьма ограничивают исполь­зование вариационно-статистических показателей, большинство из которых в строгом смысле применимы лишь при нормальном распределении величин. Эти трудности преодолеваются путем нормирующих преобразований, разработанных для каждого рас­пределения.

Часто численность мелких почвенных животных, таких как коллемболы, клещи, а тем более щематоды, 'варьирует в очень больших пределах. Так, число особей отдельных видов коллем­бол в пробах 5x5 см может колебаться от 0 до нескольких со­тен. В силу этого иногда невозможно сгруппировать непосред­ственно цифры вариационного ряда, так как почти каждая про­ба имеет свое число особей. В таких случаях весь ряд получен­ных цифр разбивают на классы. Например, если животное встречено в пробах от 1 до 30, то полученные цифры можно разбить на классы: 1—5, 6—10, 11 —15, 16—20, 21—25, 26—30.

Подсчитав число проб с каждым из классов, можно построить гистограмму точно таким же образом, как на рис. 18 и 19. На оси ординат мы откладываем классы обилия, на оси абсцисс — Частоты. Классовый интервал (в данном случае—5 особей) может быть самым различным, что зависит от уровня числен­ности, размера проб и от целей обработки Чаще всего выделя­ют 5—7 классов. Обычно классовые интервалы бывают равные

186

по всему ряду, что увеличивает возможность дальнейших ма­тематических операций с полученными данными. Однако ино­гда можно использовать шкалу с разными интервалами. Так, ногохвостка Folsomia diplophthalma в тундре встречена в про­бах (всего 100 проб) в количестве от 0 до 160 особей. Однако подавляющее число проб содержало от 1 до 40 особей, всего

6 проб — свыше 40. Вероятно, в этом случае интервал от 40 до 160 целесообразно объединить в один класс. Группировка учет­ных данных по классам обилия широко используется для раз­личных целей в почвенной зоологии. Это сильно облегчает ана­лиз количественных материалов.

После нахождения величин, характеризующих уровень при­знака (средняя арифметическая, иногда средняя геометриче­ская, мода, медиана), амплитуду, тип распределения, как ира вило, встает задача расчета показателей, отражающих меру варьирования исследуемых величин. Наиболее распространен­ный из них — среднее квадратичное отклонение (о):

где х, — величины данного признака в отдельных измерениях (например, число особей в отдельных пробах), М — средняя арифметическая, п — число измерений (проб), т. е повторность. Выражение х, — М называют отклонением (различие между от­дельными измерениями и средней). При больших повторностях, например более 30 проб, величину п—1 можно заменить на п, но при очень малых выборках, наоборот, рекомендуется делить на и — 2 (Урбах, 1964; Василевич, 1969).

Таким образом, сред­нее квадратическое отклонение—это корень из суммы квадра­тов отклонений, деленной на число повторностей. Оно показы-

187

вает, насколько в среднем каждое отдельное измерение удале­но от средней арифметической, о измеряется в тех же величи­нах, что и средняя арифметическая, т. е. это величина именованная. Средняя арифметическая в совокупности со сред­ним квадратическим отклонением в общем характеризует харак­тер распределения признака. Однако надо помнить, что а может строго применяться только в случаях более или менее нормаль­ного распределения. При больших выборках (ц^ЗО) о может применяться строго независимо от характера реального распре­деления (Урбах, 1964). В этом случае в границах Л1±о находит­ся примерно 68% всей совокупности величин признака (гене­ральная совокупность), в границах Л4±2ц — 95%, а в границах Л4±3а — 99,7% (Василевич, 1969).

Как уже отмечалось, а измеряется в тех же единицах, что и средняя. Но иногда встает задача сравнить характер варьирова­ния признаков в двух или нескольких различных вариационных рядах, например, полученных в результате учета разных групп животных разными методами. При этом средняя арифметиче­ская может выражаться в разных единицах (экз./дм2, экз./дм2, экз./см3 и т. д.). Для сравнения таких рядов используют коэффи­циент вариации, который обозначают CV или V:

Коэффициент вариации —это процент сигмы от средней ариф­метической. Обычно наиболее многочисленные доминирующие виды имеют меньший коэффициент вариации. При снижении численности усиливается, случайность попадания вида в пробы, в связи с чем у видов, учитываемых в пробах единичными экзем­плярами, коэффициент вариации очень велик. Но надо помнить, что это не всегда отражает действительный характер распреде­ления вида по площади. Чаще различия в величине V связаны именно с неравноценностью данного размера проб для разных видов, отличающихся активностью, подвижностью, величиной и т.

д. При увеличении размера проб соотношения коэффициентов вариации могут коренным образом измениться.

При вариационно-статистической обработке количественных данных широко используются ошибки средней арифметической, среднего квадратического отклонения и коэффициента вариации. Они показывают границы, в которых находится истинное значе­ние данных величин (в генеральной совокупности). Ошибка средней арифметической (т или Sj):

В границах от Л4 — 2т до М+2т генеральная средняя нахо­дится с вероятностью 95%. Это означает, что в 95 случаях из 100 истинное значение средней арифметической отстоит от вы­борочной средней не более, чем на две ошибки средней, но в пя-

188

ти случаях из 100 оно будет находиться вне этого интервала. Ес­ли же исследователь считает, что возможность ошибиться в 5% случаев слишком велика, можно расширить доверительный ин­тервал для средней от М — Зт до ЛГ+З/п. В этом случае веро­ятность того, что генеральная совокупность лежит в указанных границах, равна 99,7% (Василевич, 1969).

Можно найти границы для генеральной средней с любой ин­тересующей нас вероятностью. Для этой цели используется так называемое нормированное отклонение:

которое представляет разницу между каким-либо значением при­знака и средней арифметической, выраженную в долях ошибки средней. Тогда доверительный интервал можно записать в общем виде как Л4±//п. Вероятности, соответствующие определенным значениям t, находят из таблиц і, которые имеются в сводках по статистике и биометрии (Зайцев, 1973). Например, при л=50 10% вероятности соответствует /=1,68. Следовательно, гене­ральная средняя с вероятностью 10% лежит в интервале от 24 до 29%.

Ошибка средней арифметической в той или иной мере может характеризовать точность полученных данных. Для этого обыч­но используют процент ошибки от средней. Эта величина иногда называется относительной ошибкой. В почвенно-зоологических исследованиях при самых больших применяемых в практике по­вторностях проб для самых массовых видов ошибка средней редко составляет менее 10% от средней (табл. 4, 5). Чаще всего для видов со средним уровнем численности она лежит в преде-

Таблица 4

Основные вариационно-статистические показатели распределения коллембол в однородном моховом покрове полигональной тундры при повторности в 30 проб 5х 5 см (Западный Таймыр)

Вид M m
<< | >>

Еще по теме ПЕРВИЧНАЯ ОБРАБОТКА КОЛИЧЕСТВЕННЫХ ДАННЫХ И НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ ПРИ АНАЛИЗЕ РАСПРЕДЕЛЕНИЯ ПОЧВЕННЫХ БЕСПОЗВОНОЧНЫХ: