Понятие
Компактность кластеров
Требование, согласно которому объекты внутри одного кластера должны быть как можно ближе друг к другу.
**Математическая интерпретация:**
Компактность обычно связывают с внутрикластерным разбросом. Для центроидных методов она может быть записана через сумму квадратов расстояний от объектов до центров своих кластеров:
$W = \sum_{k=1}^{K} \sum_{x_i \in C_k} \|x_i - \mu_k\|^2$,
где $C_k$ — k-й кластер, $\mu_k$ — его центр, $K$ — число кластеров.
**Интерпретация:**
Чем меньше значение $W$, тем плотнее объекты сгруппированы вокруг своих центров. На этом принципе основан функционал k-средних и многие внутренние метрики качества. Однако минимизация только компактности может привести к искусственному дроблению данных на слишком большое число кластеров. Поэтому компактность обычно рассматривается вместе с разделимостью.