Понятие
Разделимость кластеров
Требование, согласно которому разные кластеры должны быть как можно дальше друг от друга.
**Математическая интерпретация:**
Разделимость можно оценивать через расстояния между центрами кластеров или через межкластерную дисперсию. Для центроидной постановки часто используется величина:
$B = \sum_{k=1}^{K} n_k \|\mu_k - \mu\|^2$,
где $n_k$ — число объектов в k-м кластере, $\mu_k$ — центр кластера, $\mu$ — общий центр выборки.
**Интерпретация:**
Чем больше межкластерная дисперсия $B$, тем сильнее центры кластеров отделены друг от друга. Хорошее разбиение обычно требует одновременно малой внутрикластерной дисперсии и большой межкластерной дисперсии. На этом соотношении построен, например, индекс Калински-Харабаша.