Метрика
Коэффициент силуэта
Эталонная внутренняя метрика качества, предложенная Р. Руссеу. Она сравнивает среднее расстояние объекта до своего кластера и до ближайшего соседнего кластера.
**Формула:**
Для объекта $i$:
$s(i) = \frac{b(i) - a(i)}{\max(a(i), b(i))}$,
где $a(i)$ — среднее расстояние от объекта $i$ до остальных объектов своего кластера, а $b(i)$ — минимальное среднее расстояние от объекта $i$ до объектов ближайшего чужого кластера.
**Интерпретация:**
* Значение близко к 1 — объект хорошо вписан в свой кластер.
* Значение около 0 — объект находится на границе.
* Отрицательное значение — объект, вероятно, отнесен к неверному кластеру.
**Практическое применение:**
Средний коэффициент силуэта по всем объектам используется для сравнения разных разбиений и подбора числа кластеров $k$ в алгоритмах, где этот параметр задается заранее.
Использует / Требует
Используется в
K-Means
как Рекомендуется после
K-Means
как Оценивается метрикой
Ward hierarchical clustering
как Оценивается метрикой
DBSCAN
как Оценивается метрикой
HDBSCAN
как Оценивается метрикой
Spectral clustering
как Оценивается метрикой
MiniBatch K-Means
как Оценивается метрикой
BIRCH
как Оценивается метрикой
Affinity propagation
как Оценивается метрикой
Gaussian mixtures
как Оценивается метрикой
Agglomerative clustering
как Оценивается метрикой
Число кластеров (k)
как Рекомендуется после
Mean-shift
как Оценивается метрикой
Компактность кластеров
как Рекомендуется после
OPTICS
как Оценивается метрикой
Bisecting K-Means
как Оценивается метрикой
Алгоритм Максимина
как Оценивается метрикой
Алгоритм ФОРЭЛЬ
как Оценивается метрикой