<<
>>

ГРАФИЧЕСКИЙ АНАЛИЗ БЕТА-РАЗНООБРАЗИЯ

Группирование и классифика­ция выборок является следующим этапом в анализе бета-раз­нообразия. Эти процедуры выполняются на основе преобразо­вания матриц, каждый элемент которой — показатель сход­ства между двумя выборками.

Неориентированные и ориентированные графы. Для эф­фективного выделения скоплений объектов существуют мето­ды сетевого анализа. Сетевой анализ матрицы оценок сходства между объектами заключается в построении некоторых типов графов, т. е. диаграмм, где объекты изображены в виде точек (кружков) — вершин графа, которые соединяются или не со­единяются линиями, называемыми ребрами графа. Степень соответствия между объектами отражается в графах или ха­рактером взаимного расположения точек, или длиной и дру­гими особенностями линии, соединяющих точки.

При анализе матриц сходства обычно используются «не­ориентированные графы», в которых линии, соединяющие вершины графа, не имеют направления. Реже применяются «ориентированные графы», в которых вершины соединены стрелками. Дендрит — один из типов неориентированного

2()

ИЗМЕРЕНИЕ И ОЦЕНКА БИОЛОГИЧЕСКОГО РАЗНООБРАЗИЯ

is

графа. Он может быть как: минимальное древо (матрица вклю­чает оценки различий между объектами) или максимальное древо (используются меры сходства). Дендрит — это ломаная линия, которая может ветвиться, но не содержит циклов. По­строение дендрита заключается в нахождении для каждого объекта наиболее сходного с ним объекта и соединении их ли­нией. В результате получается ряд отрезков, в том числе и раз­ветвленных.

Построить дендрит (рис. 52) можно с помощью матрицы сходства выборочных совокупностей, например (А—Е), вычис­ленной на основе индекса сходства Жаккара (табл. 10). Для этого последовательно соединяем две наиболее сходные выбор­ки Г и Д (0,9) отрезком. Следующая по силе величина сход­ства 0,85 обнаружена между выборками Г и В. Поэтому вы­борку В можно присоединить отрезком к уже построенной вет­ке Д — Г и т.

д.

Рис. 52.

Последовательные этапы построения дендрита на основе матрицы сходства выборок

291

ГЛАВАV

Таблица 10

Матрица сходства выборочных совокупностей

А Б В Г Д Е
А 0,80 0,20 0,40 0,50 0,60
Б 0,80 0,30 0,55 0,45 0,65
В 0,20 0,30 0,85 0,15 0,10
Г 0,40 0,55 0,85 0,90 0,75
д 0,50 0,45 0,15 0,90 0,25
Е 0,60 0,65 0,10 0,75 0,25

Основной недостаток этого графика — потеря информа­ции, заключенной в матрице оценок сходства, в результате использования только немногих (максимальных для каждого объекта) значений показателя соответствия.

Плеяды Терентьева. Одним из видов графического анали­за сходства выборок может быть построение плеяд Терентьева.

Этот тип графика в отличие от дендрита учитывает всю матри­цу сходства. Плеяды Терентьева (рис. 53) также можно постро­ить с помощью матрицы фаунистического сходства, вычислен­ной на основе индекса сходства Жаккара (см. табл. 10).

Такой тип графика является неориентированным графом. На нем все объекты могут быть соединены линиями, отража­ющими связи и меру сходства объектов. Толщина или харак­тер линий соответствуют определенному интервалу значений

Один из типов неориентированного графа - плеяд Терентьева, построенный на основе матрицы сходства выборок, где величины индекса сходства; 1 — [0,7:;0,9]; 2 - [0,4; 0,7]; 3 - [0,2; 0,4]

292

ИЗМЕРЕНИЕ И ОЦЕНКА БИОЛОГИЧЕСКОГО РАЗНООБРАЗИЯ

индекса сходства. Другой графический вариант плеяд Терен­тьева показывает взаимосвязи между выборками на разных уровнях сходства: 0,8, 0,5 и 0,2 (рис. 54).

На уровне сходства 0,8 есть взаимосвязь между объекта­ми Г и В, Г и Д, а также А и Б. На уровне сходства 0,5 прибав­ляются взаимосвязи между объектами Д и А, Г и Е, Г и Б, Аи Е, Б и Е и т. д.

Дендрограмма ( кластерный, анализ ). Если сравнивать не­сколько участков, хорошее представление о бета-разнообразии может дать кластерный анализ.

Кластерный анализ — один из методов многомерного анализа, сущность которого состоит в иерархической клас­сификации объектов в разделении множества объектов на од­нородные группы. Графически иерархическая классификация отображается в виде дендрограммы (дерева).

Один из типов плеяд Терентьева. Взаимосвязи между объектами показаны на уровнях сходства 0,8; 0,5 и 0,2

293

rf.

ГЛАВА V

Внутри каждой группы, получаемой в результате разбие­ния объектов на кластеры (группы), объекты более сходны, чем с объектами из других групп. Кластерный анализ начи­нается с составления матрицы сходства для каждой пары срав­ниваемых объектов.

Затем проводится последовательное объ­единение объектов в группы по степени их сходства, пока все они не будут включены в одну группу. Поскольку интерпре­тация результатов кластерного анализа зависит от визуальной оценки дендрограммы, лучше всего использовать этот прием для небольшого количества данных.

В качестве примера рассмотрим кластеризацию выборок на основе матрицы индексов сходства (см. табл. 10). Простей­шие методы кластерного анализа, применяемого в биоценоло­гии, биогеографии и числовой таксономии разными автора­ми, описаны Ю.А. Песенко (1982). Эти методы могут быть с ус­пехом использованы и в экологических исследованиях при анализе бета-разнообразия.

В наиболее простых случаях процесс группировки начи­нается с нахождения в матрице индексов сходства пары наи­более похожих объектов. Самыми близкими объектами в при­мере, рассмотренном в табл. 10, являются Г и Д (0,90). Эти объекты отображаются на графике двумя соседними точками (рис. 55).

Отходящие от точек параллельные линии соединяются отрезком на уровне величины сходства и объединяются в один

Рис. 55-

Дендрограмма кластерного анализа шести объектов, построенная методом одиночного присоединения (ближайшего соседа)

294

ИЗМЕРЕНИЕ И ОЦЕНКА БИОЛОГИЧЕСКОГО РАЗНООБРАЗИЯ

кластер. Затем в матрице индексов сходства находится вто­рой по величине индекс сходства. Если он связывает-два дру­гих, еще не объединенных в группу объекта, то их соединяют так же как и первые два, но отдельно от них на соответствую­щем уровне сходства. В нашем примере вторая по силе связь имеется между объектами Г и В (0,85), при этом один из этих объектов уже объединен в кластер. В этом случае присоедине­ние связанного с ним нового объекта может быть произведено тремя разными способами: одиночным, полным и средним присоединением.

Одиночное присоединение называют также «методом ближнего соседа». Метод впервые использован Серенсеном в 1948 г.

Соединение групп производится по максимальному значению сходства между объектами из каждой группы. Сле­дуя этому методу, объект В присоединяется к объектам Д и Г, уже объединенным в кластер. Следующее по величине сход­ство — между объектами А и Б (0,80). Они группируются в от­дельный кластер на уровне сходства. Затем идет присоеди­нение объекта Е к группе из объединенных ранее объектов Д Г В, так как между объектами Е и Г сходство равно 0,75. На последнем этапе соединяются два сформированных ранее кла­стера ДГВЕиАБв один на уровне 0,60. Результаты объеди­нения показаны на рис. 55.

Полное присоединение называют также «методом даль­него соседа». Метод был впервые предложен Снятом в 1957 г. Согласно этому правилу, после формирования кластеров ДГ

Рис. 56.

Дендрограмма кластерного анализа шести объектов, построенная методом полного присоединения (дальнего соседа)

295

flL

ГЛАВАV

и АБ к группе АБ присоединяется объект Е, так как мини­мальное сходство этого объекта с объектами этого кластера равно 0,60. Объект В присоединяется к группе ДГ только на уровне 0,15 (минимальное сходство с каждым из объек­тов группы). Этот объект нельзя присоединить к кластеру ЕАБ, так как минимальное сходство объекта Е с объектами этой группы всего 0,10. Результаты объединения показаны на рис. 56.

Среднее присоединение. Этот метод включает несколько вариантов. Он был предложен в 1958 г. Сокалом, Майченером и Олсоном, Миллером одновременно. Один из самых простых вариантов этого вида кластерного анализа заключается в ис­пользовании средних арифметических невзвешенных значе­ний сходства присоединенного объекта со всеми объектами группы. Соединяются кластеры, среднее сходство между объектами которых выше. Согласно этому методу, после фор­мирования кластеров ДГ и АБ к группе АБ присоединяется объект Е, так как среднее сходство этого объекта с объектами этого кластера (0,6 + 0,65)/2 = 0,625.

Этот объект нельзя присоединить к кластеру В (сходство всего 0,10) или кластеру ДГ (среднее сходство равно 0,50). Затем к группе ДГ присое­диняется объект В, так как среднее сходство его с объектами данного кластера равно 0,5, а с группой ЕАБ — лишь 0,20. Последний шаг — объединение групп ДГВ и ЕАБ в один клас­тер на уровне 0,49, так как эта величина показывает среднюю

Рис. 57.

Дендрограмма кластерного анализа шести объектов, построенная методом среднего присоединения

296

ИЗМЕРЕНИЕ И ОЦЕНКА БИОЛОГИЧЕСКОГО РАЗНООБРАЗИЯ

связь между объектами в двух группах. Результаты объеди­нения показаны на рис. 57.

Более сложные и разнообразные методы кластерного ана­лиза реализуются с помощью вычислительной техники. Раз­работано множество статистических пакетов программ, таких как Statgraphice, Statistica, STADIA и др., которые выполня­ют кластерный анализ.

<< | >>
Источник: Лебедева Н.В., И др.. Биологическое разнообразие: Учеб, пособие для студ. высш. учеб, заведений. — М.: Гу манит, изд. центр ВЛАДОС,2004. — 432 с.. 2004

Еще по теме ГРАФИЧЕСКИЙ АНАЛИЗ БЕТА-РАЗНООБРАЗИЯ: