Понятие
Bisecting K-Means
Bisecting K-Means — дивизимный вариант k-средних, в котором иерархия строится сверху вниз.
**Принцип работы:**
Сначала все объекты помещаются в один общий кластер. Затем один из существующих кластеров выбирается для разделения и разбивается на две части с помощью K-Means при $k=2$. Процесс повторяется, пока не будет получено требуемое число кластеров.
**Критерий выбора кластера для деления:**
Обычно выбирается кластер с наибольшей внутрикластерной суммой квадратов:
$SSE(C) = \sum_{x_i \in C} \|x_i - \mu_C\|^2$.
Такой выбор позволяет сначала дробить наиболее неоднородные группы.
**Связь с теорией:**
По Б.Г. Миркину такие методы относятся к делимым иерархическим процедурам. Они дают дерево разбиений, но используют локальный критерий k-средних.
**Преимущества:**
Метод часто устойчивее обычного K-Means при большом числе кластеров и хорошо масштабируется.
**Ограничения:**
Как и K-Means, предполагает компактные кластеры и чувствителен к инициализации центров при каждом бинарном разбиении.
Использует / Требует
Является (Is A)
Алгоритмы разбиения (Partitioning)
Использует
Расстояние между точками (Евклидово)
Расширяет метод
K-Means
Оценивается метрикой
Скорректированный индекс Рэнда
Оценивается метрикой
Индекс Калински-Харабаша
Оценивается метрикой
Индекс Дэвиса-Болдина
Оценивается метрикой
Коэффициент силуэта
Имеет параметр
Число кластеров (k)
Решает прикладную задачу
Универсальное применение (Базовый анализ)
Поддерживает геометрию
Выпуклая геометрия
Предполагает размер кластеров
Равномерные размеры
Имеет масштабируемость
Высокая масштабируемость
Имеет тип логического вывода
Индуктивный вывод