Понятие

Разделимость кластеров

Требование, согласно которому разные кластеры должны быть как можно дальше друг от друга. **Математическая интерпретация:** Разделимость можно оценивать через расстояния между центрами кластеров или через межкластерную дисперсию. Для центроидной постановки часто используется величина: $B = \sum_{k=1}^{K} n_k \|\mu_k - \mu\|^2$, где $n_k$ — число объектов в k-м кластере, $\mu_k$ — центр кластера, $\mu$ — общий центр выборки. **Интерпретация:** Чем больше межкластерная дисперсия $B$, тем сильнее центры кластеров отделены друг от друга. Хорошее разбиение обычно требует одновременно малой внутрикластерной дисперсии и большой межкластерной дисперсии. На этом соотношении построен, например, индекс Калински-Харабаша.