Метрика

Коэффициент силуэта

Эталонная внутренняя метрика качества, предложенная Р. Руссеу. Она сравнивает среднее расстояние объекта до своего кластера и до ближайшего соседнего кластера. **Формула:** Для объекта $i$: $s(i) = \frac{b(i) - a(i)}{\max(a(i), b(i))}$, где $a(i)$ — среднее расстояние от объекта $i$ до остальных объектов своего кластера, а $b(i)$ — минимальное среднее расстояние от объекта $i$ до объектов ближайшего чужого кластера. **Интерпретация:** * Значение близко к 1 — объект хорошо вписан в свой кластер. * Значение около 0 — объект находится на границе. * Отрицательное значение — объект, вероятно, отнесен к неверному кластеру. **Практическое применение:** Средний коэффициент силуэта по всем объектам используется для сравнения разных разбиений и подбора числа кластеров $k$ в алгоритмах, где этот параметр задается заранее.