Понятие

Компактность кластеров

Требование, согласно которому объекты внутри одного кластера должны быть как можно ближе друг к другу. **Математическая интерпретация:** Компактность обычно связывают с внутрикластерным разбросом. Для центроидных методов она может быть записана через сумму квадратов расстояний от объектов до центров своих кластеров: $W = \sum_{k=1}^{K} \sum_{x_i \in C_k} \|x_i - \mu_k\|^2$, где $C_k$ — k-й кластер, $\mu_k$ — его центр, $K$ — число кластеров. **Интерпретация:** Чем меньше значение $W$, тем плотнее объекты сгруппированы вокруг своих центров. На этом принципе основан функционал k-средних и многие внутренние метрики качества. Однако минимизация только компактности может привести к искусственному дроблению данных на слишком большое число кластеров. Поэтому компактность обычно рассматривается вместе с разделимостью.