Количество часов на выполнение лабораторной работы – 2 часа — КиберПедия 

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Количество часов на выполнение лабораторной работы – 2 часа

2021-04-18 158
Количество часов на выполнение лабораторной работы – 2 часа 0.00 из 5.00 0 оценок
Заказать работу

Задание. 1. Создайте произвольную клиентскую базу данных в формате Excel (не менее 200 клиентов, не менее 5-ти параметров). Импортируйте данную базу данных, предварительно сохранив в формате – «разделители запятые».

2. Выбрав инструмент «Карты Кохонена», запустите сценарий сегментации. Проинтерпретируйте результаты сегментации, проведя визуальный анализ карт признаков. Дайте каждому сегменту клиентов название. Оцените численность каждого сегмента и постройте соответствующую диаграмму. Постройте дерево решений для объяснения результатов сегментации. Для обучения используйте 60% от всех данных, остальные – для тестирования.

3. В соответствии со спецификой компании, для которой проводилась сегментация клиентов, сформулируйте оптимальную политику взаимодействия с каждой выявленной группой. Обоснуйте предложенные варианты мероприятий.

Обработчик и визуализатор «Дерево решений»

Построение дерева решений производится в процессе обучения. Настройки параметров обучения можно изменить в окне мастера (рис. 3)

Рисунок 3 - Параметры обучения обработчика «Дерево решений»

 

Параметры обучения дерева решений следующие:

􀂃 Минимальное количество примеров, при котором будет создан новый узел. Задается минимальное количество примеров, которое возможно в узле. Если примеров, которые попадают в данный узел, будет меньше заданного - узел считается листом (т.е. дальнейшее ветвление прекращается). Чем больше этот параметр, тем менее ветвистым получается дерево.

􀂃 Строить дерево с более достоверными правилами в ущерб сложности. Включает специальный алгоритм, который, усложняя структуру дерева, увеличивает достоверность результатов классификации. При этом дерево получается, как правило, более ветвистым.

􀂃 Уровень доверия, используемый при отсечении узлов дерева. Значение этого параметра задается в процентах и должно лежать в пределах от 0 до 100. Чем больше уровень доверия, тем более ветвистым получается дерево, и, соответственно, чем меньше уровень доверия, тем больше узлов будет отсечено при его построении. Для просмотра дерево решений предназначен одноименный визуализатор (рис. 4).

Рисунок 4 - Пример дерева решений

Обработчик «Группировка»

Группировка позволяет объединять записи по полям - измерениям, агрегируя данные в полях-фактах для дальнейшего анализа. Для настройки группировки требуется указать, какие поля являются измерениями, а какие – фактами. Для каждого факта требуется указать функцию агрегации. Это может быть сумма, среднее, максимум, минимум, количество. При выполнении группировки в таблице данных ищутся записи с одинаковыми полями-измерениями. К полям- фактам таких записей применяются функции агрегации. Группировка осуществляется и при построении OLAP-куба. Однако, в отличие от куба, при использовании обработчика «Группировка» формируется таблица со сгруппированными значениями, которую можно в дальнейшем использовать для обработки другими алгоритмами (обработчиками) Deductor.

Обработчик «Сортировка»

С помощью сортировки можно изменять порядок следования записей в исходной выборке данных в соответствии с заданным пользователем алгоритмом сортировки. Результатом выполнения сортировки будет новый набор данных, записи в которой будут следовать в соответствии с заданными параметрами сортировки.

В окне настройки параметров сортировки представлен список условий сортировки, в котором содержатся две графы:

􀂃 Имя поля - содержит имя полей, по которым следует выполнить сортировку.

􀂃 Порядок сортировки - содержит порядок сортировки данных в соответствующем поле – по возрастанию или по убыванию.


Поделиться с друзьями:

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.009 с.