Параметр
Число кластеров (k)
Ключевой гиперпараметр для алгоритмов разбиения (*K-Means*, *Spectral Clustering*). Пользователь обязан до начала работы алгоритма указать, на сколько именно групп ($k$) нужно разбить данные.
**Теоретическая проблема:**
Поскольку задача кластеризации некорректна (нет правильных ответов), выбор $k$ полностью ложится на плечи исследователя.
* Если $k$ слишком мало: различные по смыслу кластеры сольются в один.
* Если $k$ слишком велико: истинные кластеры будут искусственно раздроблены (переобучение).
**Методы подбора:** Эвристика Максимина (для начальных точек), «Метод локтя» (Elbow method) или максимизация Коэффициента силуэта.
Использует / Требует
Используется в
K-Means
как Имеет параметр
Ward hierarchical clustering
как Имеет параметр
Spectral clustering
как Имеет параметр
MiniBatch K-Means
как Имеет параметр
Agglomerative clustering
как Имеет параметр
Коэффициент силуэта
как Зависит от (Пререквизит)
Коэффициент силуэта
как Помогает подобрать параметр
Индекс Калински-Харабаша
как Зависит от (Пререквизит)
Индекс Калински-Харабаша
как Помогает подобрать параметр
Индекс Дэвиса-Болдина
как Зависит от (Пререквизит)
Bisecting K-Means
как Имеет параметр