Методы многомерных группировок (или методы многомерной классификации) — КиберПедия 

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Методы многомерных группировок (или методы многомерной классификации)

2021-05-27 32
Методы многомерных группировок (или методы многомерной классификации) 0.00 из 5.00 0 оценок
Заказать работу

Задача многомерного статистического анализа — построение и оценка многофакторных моделей, учитывающих сложные взаимодействия данного фактора с другими.

Методы многомерных группировок— методы, цель которых — классификация (группировка) на основе множества признаков. Простейший вариант многомерной классификации — группировка на основе многомерных средних. Многомерная средняя — средняя величина нескольких признаков для одной единицы совокупности. Многомерная средняя вычисляется из относительных величин — из отношений значений признаков для единицы совокупности к средним значениям этих признаков.

Использование в статистических исследованиях ЭВМ и статистической теории распознавания образов позволило разработать метод группировки совокупности единиц одновременно по множеству характеризующих признаков. Такие группировки получили название многомерных.

Многомерная группировка или многомерная классификация основана на измерении сходства или различия между объектами(единицами): единицы, отнесенные к одной группе (классу), различаются между собой меньше, чем единицы, отнесенные к различным группам (классам). Мерой близости (сходства) между объектами могут служить различные критерии. Самой распространенной мерой близости является евклидово расстояние между объектам, представленными точками в n-мерном пространстве. Чем меньше это расстояние, тем больше близость.

Задача многомерной группировки сводится к выделению сгущений точек(объектов) в n-мерном пространстве. Группы(кластеры) формируются на основании близости объектов одновременно по всему комплексу признаков, описывающих объект. Нахождение этих групп осуществляется методами кластерного анализа на ЭВМ.

Многомерные группировки позволяют решать целый ряд таких важных задач экономико-статистического исследования, как формирование однородных совокупностей, выбор существенных признаков, выделение типичных групп объектов и др. в зависимости от вида группировочных признаков различают группировки по атрибутивным и количественным признакам. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Таковы, например, группировки населения по полу, семейному положению, образованию; распределение числа групп при группировке по варьирующему количественному признаку (например, распределение населения по уровню доходов, потреблению отдельных продуктов питания и др.) требует специальных расчетов.

Цель многомерных группировок - классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно. В процессе такой группировки решаются, например, задачи типизации - выделяются самостоятельные экономические или социальные типы явлений. Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно- производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д.

При выполнении многомерных группировок могут быть использованы два основных подхода:

* Первый заключается в том, что рассчитывается обобщающий показатель по совокупности группировочных признаков и проводится простая группировка по этому обобщающему показателю.

* Второй подход состоит в использовании методом кластерного анализа.

Представителем первого подхода является метод многомерной средней, алгоритм которого заключается в следующем:

1. Составляется матрица абсолютных значений признаков по всем статистическим единицам - xij,

i=1,n - статистические единицы,

j=1,k - признаки.

2. Абсолютные значения признаков заменяются их нормированными по среднему значению уровнями:

(4)

где Pij - нормированное значение j-ого признака у i-ой статистической единицы;

x - среднее значение j-того признака,

(5)

3. Для каждой статистической единицы рассчитывается многомерная средняя:

(6)

k - число оснований группировки;

4. В соответствии со значениями многомерной средней совокупность разделяется на однородные группы, то есть выполняется простая группировка по многомерной средней.

При втором подходе к выполнению многомерных группировок каждая единица совокупности, обладающая набором из k признаков рассматривается как точка в k-мерном пространстве - пространстве признаков, а каждому признаку придается смысл координаты. Задача классификации в этом случае сводится к выделению сгущений объектов в этом пространстве. Для этого используются различные алгоритмы, но всегда однородные группы выделяются на основании близости объектов по совокупности признаков.

Мерой близости объектов, то есть мерой сходства единиц совокупности, могут служить различные критерии.

Выделяют три типа мер сходства:

* Коэффициенты подобия;

* коэффициенты связи;

* показатели расстояния.

Коэффициенты подобия используются для измерения степени близости между парой объектов, каждый из признаков которых принимает значения 0 или 1.

Наиболее простой коэффициент подобия рассчитывается по формуле:

 (7)

где Pij - число совпадений признаков у объектов i и j;

m - общее число признаков, по которым осуществляется сравнение.

Коэффициенты корреляции используются как измерители силы связи между статистическими единицами или между признаками. Для измерения тесноты связи количественных признаков применяют коэффициенты линейной корреляции.


Поделиться с друзьями:

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.009 с.