Параметр

Число кластеров (k)

Ключевой гиперпараметр для алгоритмов разбиения (*K-Means*, *Spectral Clustering*). Пользователь обязан до начала работы алгоритма указать, на сколько именно групп ($k$) нужно разбить данные. **Теоретическая проблема:** Поскольку задача кластеризации некорректна (нет правильных ответов), выбор $k$ полностью ложится на плечи исследователя. * Если $k$ слишком мало: различные по смыслу кластеры сольются в один. * Если $k$ слишком велико: истинные кластеры будут искусственно раздроблены (переобучение). **Методы подбора:** Эвристика Максимина (для начальных точек), «Метод локтя» (Elbow method) или максимизация Коэффициента силуэта.