Понятие

Bisecting K-Means

Bisecting K-Means — дивизимный вариант k-средних, в котором иерархия строится сверху вниз. **Принцип работы:** Сначала все объекты помещаются в один общий кластер. Затем один из существующих кластеров выбирается для разделения и разбивается на две части с помощью K-Means при $k=2$. Процесс повторяется, пока не будет получено требуемое число кластеров. **Критерий выбора кластера для деления:** Обычно выбирается кластер с наибольшей внутрикластерной суммой квадратов: $SSE(C) = \sum_{x_i \in C} \|x_i - \mu_C\|^2$. Такой выбор позволяет сначала дробить наиболее неоднородные группы. **Связь с теорией:** По Б.Г. Миркину такие методы относятся к делимым иерархическим процедурам. Они дают дерево разбиений, но используют локальный критерий k-средних. **Преимущества:** Метод часто устойчивее обычного K-Means при большом числе кластеров и хорошо масштабируется. **Ограничения:** Как и K-Means, предполагает компактные кластеры и чувствителен к инициализации центров при каждом бинарном разбиении.