Метод ближайшего соседа и его обобщения — КиберПедия 

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Метод ближайшего соседа и его обобщения

2017-09-10 458
Метод ближайшего соседа и его обобщения 0.00 из 5.00 0 оценок
Заказать работу

Пусть на множестве объектов X задана функция расстояния

ρ: X×X → [0,∞).

Существует целевая зависимость y∗: X → Y, значения которой известны только на объектах обучающей выборки X = (xi,yi)i=1, yi = y∗(xi). Множество классов Y конечно. Требуется построить алгоритм классификации a: X → Y, аппроксимирующий целевую зависимость y∗(x) на всём множестве X.

Обобщённый метрический классификатор

Для произвольного объекта u ∈ X расположим элементы обучающей выборки x1,...,x в порядке возрастания расстояний до u:

где через x(i)u обозначается i-й сосед объекта u. Соответственно, ответ на i-м соседе объекта u есть y(i)u = y∗(x(i)u). Таким образом, любой объект u ∈ X порождает свою перенумерацию выборки.

Метрический алгоритм классификации с обучающей выборкой X относит объект u к тому классу y ∈ Y, для которого суммарный вес ближайших обучающих объектов Гy(u,X) максимален:

где весовая функция w(i,u) оценивает степень важности i-го соседа для классификации объекта u. Функция Γy(u,X) называется оценкой близости объекта u к классу y.

Метрический классификатор определён с точностью до весовой функции w(i,u). Обычно она выбирается неотрицательной, не возрастающей по i. Это соответствует гипотезе компактности, согласно которой чем ближе объекты u и x(i)u, тем выше шансы, что они принадлежат одному классу. Обучающая выборка Xℓ играет роль параметра алгоритма a. Настройка сводится к запоминанию выборки, и, возможно, оптимизации каких-то параметров весовой функции, однако сами объекты не подвергаются обработке и сохраняются «как есть». Алгоритм a(u;X) строит локальную аппроксимацию выборки Xℓ, причём вычисления откладываются до момента, пока не станет известен объект u. По этой причине метрические алгоритмы относятся к методам ленивого обучения (lazy learning), в отличие от усердного обучения (eager learning), когда на этапе обучения строится функция, аппроксимирующая выборку. Метрические алгоритмы классификации относятся также к методам рассуждения по прецедентам (case-based reasoning, CBR). Здесь действительно можно говорить о «рассуждении», так как на вопрос «почему объект u был отнесён к классу y?» алгоритм может дать понятное экспертам объяснение: «потому, что имеются схожие с ним прецеденты класса y», и предъявить список этих прецедентов. Выбирая весовую функцию w(i,u), можно получать различные метрические классификаторы, которые подробно рассматриваются ниже.

Метод ближайших соседей

Алгоритм ближайшего соседа (nearest neighbor, NN) относит классифицируемый объект u ∈ X к тому классу, которому принадлежит ближайший обучающий объект: w(i,u) = [i = 1]; a(u;X) = y(1)u.

Этот алгоритм является, по всей видимости, самым простым классификатором. Обучение NN сводится к запоминанию выборки X. Единственное достоинство этого алгоритма — простота реализации. Недостатков гораздо больше:

• Неустойчивость к погрешностям. Если среди обучающих объектов есть выброс — объект, находящийся в окружении объектов чужого класса, то не только он сам будет классифицирован неверно, но и те окружающие его объекты, для которых он окажется ближайшим.

• Отсутствие параметров, которые можно было бы настраивать по выборке. Алгоритм полностью зависит от того, насколько удачно выбрана метрика ρ.

• В результате — низкое качество классификации.


Поделиться с друзьями:

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.009 с.