Понятие

Agglomerative clustering

Агломеративная кластеризация — семейство иерархических методов, в которых дерево кластеров строится снизу вверх. **Принцип работы:** В начале каждый объект считается отдельным кластером. Далее на каждом шаге объединяются две наиболее близкие группы. Процесс продолжается до тех пор, пока все объекты не окажутся в одном корневом кластере или пока не будет достигнут заданный порог расстояния. **Функция близости кластеров:** Разные варианты агломеративного метода отличаются правилом связи: 1. **single linkage** — расстояние между ближайшими объектами двух кластеров; 2. **complete linkage** — расстояние между наиболее удаленными объектами; 3. **average linkage** — среднее попарное расстояние; 4. **Ward linkage** — минимизация прироста внутрикластерной дисперсии. **Результат:** Итогом является дендрограмма, на которой можно выбрать уровень среза и получить нужное число кластеров. **Ограничения:** Метод хорошо интерпретируется визуально, но для больших выборок может быть затратным из-за необходимости хранить или вычислять попарные расстояния.