Дендрограммы (кластерный анализ) — КиберПедия 

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Дендрограммы (кластерный анализ)

2021-12-12 37
Дендрограммы (кластерный анализ) 0.00 из 5.00 0 оценок
Заказать работу

В том случае, если в ходе анализа бета-разнообразия необхо­димо выделять скопления анализируемых выборок или разбить их на некоторое число групп, можно воспользоваться методами кластерного анализа.

Кластерный анализ — один из методов многомерного анали­за, сущность которого состоит в иерархической классификации объектов и разделении множества объектов на однородные груп­пы. Внутри каждой группы, получаемой в результате разбивки объектов на кластеры (группы), объекты более сходны, чем с объектами из других групп. В ходе кластерного анализа на осно­вании анализа вторичной матрицы сходства проводится последо­вательное объединение объектов в группы по степени их сходст­ва, пока все они не будут включены в одну группу.

Графически иерархическая классификация отображается в виде дендрограммы (дерева). Интерпретация результатов кла­стерного анализа в очень большой степени зависит от визуаль­ной оценки дендрограммы, которая строится следующим об­разом.

В наиболее простом случае процесс группировки выборок в ходе кластерного анализа начинается с нахождения во вторич­ной матрице, содержащей оценки сходства между всеми анали­зируемыми выборками, пары наиболее сходных выборок. Эти выборки отражаются соседними точками на одной из осей. От­ходящие от точек параллельные линии соединяются перпенди­кулярным отрезком на данном уровне сходства, который откла­дывается на другой оси двумерной координатной сетки. Напри­мер, если на оси абсцисс располагаются точки, обозначающие анализируемые выборки, то на оси ординат отмечается уровень сходства. Таким образом, сходные выборки объединяются в один кластер.

Затем по вторичной матрице находится вторая по величине оценка сходства. Если она связывает две другие, еще не объеди­ненные в группу выборки, то их соединяют на графике так же, как и первые две, но отдельно от них и на соответствующем уровне сходства. Если же следующая по силе связь относится к одной из уже соединенных выборок, то присоединение связан­ной с ней новой выборки может происходить тремя основными способами: одиночным, полным и средним присоединением.

Одиночное присоединение. Его называют также методом ближнего соседа (single linkage). Соединение групп производит­ся по максимальному значению сходства между объектами из каждой группы.

Полное присоединение, или метод дальнего соседа (complete linkage). Соединение групп проводится по минимальному значе­нию сходства между объектами из каждой группы.

Среднее присоединение. Этот метод включает несколько ва­риантов. Могут использоваться средние арифметические невзве-шенные значения сходства присоединенного объекта со всеми объектами группы; взвешенные средние арифметические значе­ния сходства; взвешенные и невзвешенные средние геометриче­ские значения сходства; взвешенные и невзвешенные средние гармонические значения сходства и др. Вариантами среднего присоединения являются центроидный метод, метод минимиза­ции внутригрупповой дисперсии (метод Уарда).

Таким образом, процедура кластерного анализа происходит до тех пор, пока все анализируемые выборки не будут объедине­ны в один кластер на минимальном уровне сходства. Анализи­руя полученную дендрограмму, можно сделать выводы о степени сходства исследуемых выборок и о возможности выделения в большей или меньшей степени обособленных групп описаний со­обществ.

Не вдаваясь в подробности математического описания ука­занных методов кластерного анализа, отметим, что большинство из них на сегодняшний день реализуется с помощью вычисли­тельной техники. Разработано множество статистических паке­тов программ, таких как SPSS, Statistica, STADIA и другие, ко­торые выполняют кластерный анализ.

ПРИМЕРЫ РАСЧЕТА ЗНАЧЕНИЙ ИНДЕКСОВ

В настоящем раздел е. рассматриваются особенности расчетов некоторых индексов, описанных выше. Предпочтение при этом отдано наиболее употребительным, расчет которых имеет опре­деленные особенности.

В качестве рабочего примера рассмотрим серию описаний лу­говой растительности, сделанных в 2006—2007 гг. в окрестно­стях геобазы БГУ «Западная Березина» (Минская обл., Воложинский р-н).

На каждой из пробных площадей (ПП 1—ПП 10), заложен­ных в пойме реки Западная Березина, было сделано по 25 учет­ных площадок размером 10x10 см, на которых был учтен видо­вой состав и надземная фитомасса каждого вида. Усредненные данные по учетным площадкам представлены в табл. 3.

Расчет индекса Шеннона

Рассчитаем индекс Шеннона для ПП 1 и ПП 2 (табл. 4).

Для расчета индекса сначала определяются доли каждого вида. Для этого биомасса каждого вида делится на суммарную биомассу. Затем из значений долей извлекается натуральный ло­гарифм. Так как доли каждого вида — числа меньше единицы, то логарифмы этих чисел являются отрицательными величина­ми. На последнем этапе расчета индекса Шеннона значение доли вида умножается на натуральный логарифм этого значения и по­лученные цифры суммируются.

 

 

 


 

В нашем примере для ПП 1 Н' = 2,387, а для ПП 2 Н' = 2,615.

Как видно из полученных результатов, абсолютные значе­ния индекса Шеннона для сравниваемых пробных площадей раз­личаются, но неизвестно, насколько достоверны эти различия. Для того чтобы это выяснить, необходимо рассчитать диспер­сию индекса Шеннона (VarH').

В нашем примере для ПП 1 VarH'=0,01326, а для ПП 2 VarH'= 0,01369.

Исходя из этих данных, можно рассчитать значение t-критерия Стьюдента. t = 10,96, что при числе степеней свободы df = 149 говорит о высокой достоверности различий в значениях индексов Шеннона для ПП 1 и ПП 2 несмотря на малые разли­чия абсолютных величин индексов.

 

Рассчитаем значения индекса выравненности по Шеннону, или индекса Пиелу. В нашем примере для ПП 1 Е = 0,73, а для ПП 2 Е = 0,77. Это говорит о том, что данные сообщества явля­ются довольно выравненными по обилию видов, в них отсутству­ют явные доминанты.

 


 

 

4.2. Расчет α лог-ряда

 

Рассчитаем α лог-ряда для ПП 1 и ПП 2.

Первый этап расчета заключается в итерационном решении уравнения

и нахождении входящей в это уравнение константы х. Удобнее

всего уравнения такого типа решать, используя электронные

таблицы, например программу Excel.

При использовании этой программы в первую из ячеек вносится значение , во вторую – число, которое будет являться значением x. На практике х не превышает 1,0. Если > 20, х > 0,99. В третьей ячейке записывается правая часть формулы, причем значения х даются как ссылка на вторую ячейку. Затем, изменяя число во второй ячейке, необходимо добиться такого его значения, при котором числа в первой и третьей ячейках совпа­дут до третьего знака после запятой. Получившееся число во вто­рой ячейке и будет искомым х.

В нашем случае для ПП 1 х = 0,707, а для ПП 2 х = 0,6795.

После расчета х можно рассчитать α лог-ряда:

 

.

В нашем случае для ПП 1 α = 31,96, а для ПП 2 α = 34,15.

Чтобы определить достоверность различий между получен­ными значениями, необходимо вначале рассчитать дисперсию полученных значений α лог-ряда.

В нашем случае для ПП 1 Var(α) = 26,03, а для ПП 2 Var(α) =30,01.

Такие высокие значения дисперсии говорят о том, что разли­чия между полученными значениями α лог-ряда для ПП 1 и ПП 2 недостоверны и сравниваемые сообщества по значению это­го индекса не различаются между собой.


Поделиться с друзьями:

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.016 с.