Алгоритм
Иерархические алгоритмы
Семейство методов, целью которых является построение не одного разбиения, а полной иерархии вложенных кластеров (таксономии). Результат визуализируется в виде **дендрограммы** — дерева, где корень — это все множество объектов, а листья — отдельные точки.
**Основные подходы:**
1. **Агломеративные (AGNES — Agglomerative Nesting):**
Стратегия «снизу-вверх». В начале каждый объект — это отдельный кластер. На каждом шаге происходит слияние двух самых близких кластеров.
* *Математика:* Расстояние между кластерами пересчитывается по рекуррентной **формуле Ланса-Уильямса** (Lance-Williams formula).
2. **Дивизимные (DIANA — Divisive Analysis):**
Стратегия «сверху-вниз». В начале все объекты в одном кластере. На каждом шаге один из кластеров расщепляется на два (обычно с помощью K-Means или спектрального метода).
**Преимущество:** Не требуют предварительного знания числа кластеров $k$. Можно «разрезать» дерево на любом уровне детализации.