Понятие

HDBSCAN

HDBSCAN — иерархическое расширение DBSCAN, предназначенное для данных с кластерами переменной плотности. **Основная идея:** Обычный DBSCAN использует один глобальный радиус $\epsilon$. HDBSCAN рассматривает разные уровни плотности и строит иерархию кластеров, после чего выбирает наиболее устойчивые группы. **Ключевые понятия:** 1. **core distance** — расстояние от точки до ее $MinPts$-го соседа; 2. **mutual reachability distance** — преобразованное расстояние, учитывающее локальную плотность; 3. **cluster stability** — устойчивость кластера при изменении уровня плотности. **Преимущества:** Метод не требует задавать $\epsilon$, лучше работает с кластерами разной плотности и автоматически выделяет шум. **Ограничения:** Результат сложнее объяснять начинающему пользователю, чем результат DBSCAN. Кроме того, интерпретация зависит от параметра минимального размера кластера и выбранного способа извлечения устойчивых групп из иерархии.