Алгоритм построения иерархической классификация (дендрограммы) — КиберПедия 

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Алгоритм построения иерархической классификация (дендрограммы)

2017-12-13 933
Алгоритм построения иерархической классификация (дендрограммы) 0.00 из 5.00 0 оценок
Заказать работу

 

Приводимый здесь алгоритм построения иерархической классификации основан на анализе значений матрицы сходства. Аналогично проводится построение иерархической классификации на основе меры различия. Рассмотрим пошаговую обработку данных для построения дендрограммы сходства с иллюстрацией ряда процедур на примерах в целях лучшего понимания алгоритма.

Шаг 1. Определяются два множества: множество исследуемых объектов J= {S1, S2,..., Sq} и множество признаков Z = { Z1, Z2,..., Zp}. Экспертно формируются индексированные множества по каждому объекту. Строится матрица сходства

 

где Sij значение меры сходства объекта Si с объектом Sj;

q — число анализируемых объектов.

Последующую иллюстрацию алгоритма осуществим на примере матрицы сходства {см. табл. 5.6).

Шаг 2. Просматриваются все элементы матрицы сходства [ С ], расположенные выше главной диагонали. Определяется и метится элемент, имеющий максимальное значение меры сходства С (Si, Sj)max (данный элемент не принадлежит к элементам главной диагонали). Для рассматриваемой матрицы сходства таким элементом является С (S4, S5) = 0,75. Если в матрице сходства более одного элемента с одинаковым максимальным значением, то отбирается и метится любой их них.

Шаг 3. Определяются номера i -й строки j -го столбца, на пересечении которых расположен отмеченныйна шаге 2 элемент. Из матрицы сходства извлекаются все значения, соответствующие i -й строке и j -му столбцу, из которых формируются два массива значений мер сходства:

 

Hi=Si   S1   S2   S3   S4   S5   S6   S7  
С (S4, Si)   0,44   0,60   0     0,75   0,25   0,67  
C(S5, Si)   0,55   0,5   0,73   0,75     0,60   0,55  

Ш а г 4. Определяется мера сходства классов G (Н, Н^) одним из методов, описываемых обобщенной формулой (5.6). Используем метод медианы. Тогда

С учетом метода медианы имеем

Hi = Si   S1   S2   S3   S4, S5   S6   S7  
С(S4,5, Si)   0,50   0,55   0,37     0,43   0,61  

 

Полученный массив данных вписывается на место четвертой и пятой строк и четвертого и пятого столбцов вновь формируемой матрицы сходства. Наша исходная матрица сходства примет следующий вид:

  S1 S2 S3 S4,5 S6 S7
S1   0,62 0,50 0,55 0,55 0,5
S2 0,62   0,46 0,55 0,50 0,62
S3 0,50 0,46   0,37 0,73 0,33
S4,5 0,50 0,55 0,37   0,43 0,61
S6 0,55 0,50 0,73 0,43   0,36
S7 0,50 0,62 0,33 0,61 0,36  

На данном шаге запоминаются значения индексов вновь образованного класса (S4,5) и меры сходства, при которой этот класс образовался, — С (S4, S5) = 0,75.

Шаг 5. Процедура обработки матрицы сходства вновь начинается с шага 2. Итерационный процесс продолжается до тех пор, пока размерность матрицы сходства не уменьшится до 2 х 2. На этом процесс построения иерархической классификации заканчивается.

В результате работы алгоритма определяются перечень индексов классов в том порядке, в котором они объединялись в новые классы, а также уровни сходства, на которых это объединение происходило. Для рассматриваемого примера имеем следующие результаты:

 

 


Полученные результаты используются для построения дендрограмм. Дендрограмма делает наглядной структуру иерархической классификации. В данном примере (рис. 5.4) наибольшим сходством обладают классы S4 и S5, наименьшим — классы Н5 = {S1, S2, S4, S5, S7} и Н2 = {S3, S6}.


Поделиться с друзьями:

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.008 с.