Понятие
Agglomerative clustering
Агломеративная кластеризация — семейство иерархических методов, в которых дерево кластеров строится снизу вверх.
**Принцип работы:**
В начале каждый объект считается отдельным кластером. Далее на каждом шаге объединяются две наиболее близкие группы. Процесс продолжается до тех пор, пока все объекты не окажутся в одном корневом кластере или пока не будет достигнут заданный порог расстояния.
**Функция близости кластеров:**
Разные варианты агломеративного метода отличаются правилом связи:
1. **single linkage** — расстояние между ближайшими объектами двух кластеров;
2. **complete linkage** — расстояние между наиболее удаленными объектами;
3. **average linkage** — среднее попарное расстояние;
4. **Ward linkage** — минимизация прироста внутрикластерной дисперсии.
**Результат:**
Итогом является дендрограмма, на которой можно выбрать уровень среза и получить нужное число кластеров.
**Ограничения:**
Метод хорошо интерпретируется визуально, но для больших выборок может быть затратным из-за необходимости хранить или вычислять попарные расстояния.
Использует / Требует
Оценивается метрикой
Скорректированный индекс Рэнда
Имеет параметр
Число кластеров (k)
Решает прикладную задачу
Выделение множества микро-кластеров
Имеет параметр
Порог расстояния (Threshold)
Имеет масштабируемость
Высокая масштабируемость
Оценивается метрикой
Индекс Дэвиса-Болдина
Оценивается метрикой
Коэффициент силуэта
Имеет тип логического вывода
Трансдуктивный вывод
Использует
Любая попарная матрица расстояний
Является (Is A)
Иерархические алгоритмы