Понятие
Mean-shift
Mean Shift — плотностной метод кластеризации, связанный с оценкой плотности распределения и поиском ее локальных максимумов. Классическое изложение метода дано Д. Команичиу и П. Меером.
**Основная идея:**
Каждая точка итеративно смещается в сторону области большей плотности. Направление сдвига задается вектором mean shift:
$m(x) = \frac{\sum_i x_i K\left(\frac{x - x_i}{h}\right)}{\sum_i K\left(\frac{x - x_i}{h}\right)} - x$,
где $K$ — ядро, $h$ — ширина окна (bandwidth).
**Результат:**
Точки, сходящиеся к одному и тому же локальному максимуму плотности, образуют кластер.
**Преимущества:**
Не нужно заранее задавать число кластеров, а форма кластеров может быть сложной.
**Ограничения:**
Качество сильно зависит от bandwidth. Слишком маленькое окно дробит данные на множество локальных групп, слишком большое — сливает разные структуры. Метод может быть вычислительно тяжелым на больших выборках.
Использует / Требует
Оценивается метрикой
Скорректированный индекс Рэнда
Имеет тип логического вывода
Индуктивный вывод
Решает прикладную задачу
Выделение множества микро-кластеров
Предполагает размер кластеров
Неравномерные размеры
Поддерживает геометрию
Произвольная (сложная) геометрия
Оценивается метрикой
Коэффициент силуэта
Имеет масштабируемость
Низкая масштабируемость
Использует
Расстояние между точками (Евклидово)
Имеет параметр
Ширина окна (Bandwidth)
Является (Is A)
Плотностные алгоритмы