Понятие
Ожидаемый размер кластеров
Характеристика алгоритма, определяющая его чувствительность к дисбалансу количества элементов в искомых группах. Это ограничение часто вытекает из математической природы оптимизируемого функционала.
**1. Равномерные размеры (Even Cluster Size):**
Многие итеративные алгоритмы (например, *K-Means*, *Ward*) стремятся минимизировать суммарную квадратичную ошибку (инерцию). Математически это приводит к тому, что алгоритм «штрафует» большие протяженные кластеры, стремясь разбить их на несколько более компактных сфер одинакового радиуса.
* *Следствие:* Если в данных есть один гигантский кластер и один маленький, такие алгоритмы часто ошибочно расщепляют большой кластер.
**2. Неравномерные размеры (Uneven Cluster Size):**
Алгоритмы, основанные на плотности (*DBSCAN*) или графовых связях (*Affinity Propagation*), не накладывают ограничений на количество точек в кластере. Кластер определяется как связная область пространства.
* *Следствие:* Позволяет корректно выделять малые группы (аномалии) на фоне массивных структур.