Понятие
Ward hierarchical clustering
Метод Уорда — агломеративный иерархический алгоритм, предложенный Дж. Уордом. Он объединяет кластеры так, чтобы на каждом шаге минимально увеличивать внутрикластерную дисперсию.
**Критерий объединения:**
Для двух кластеров $A$ и $B$ прирост ошибки можно записать как:
$\Delta(A,B) = \frac{|A||B|}{|A| + |B|}\|\mu_A - \mu_B\|^2$,
где $\mu_A$ и $\mu_B$ — центры кластеров, $|A|$ и $|B|$ — их мощности.
**Интерпретация:**
Метод стремится строить компактные кластеры и близок по смыслу к критерию k-средних, но формирует не одно плоское разбиение, а полную иерархию.
**Преимущества:**
Хорошо подходит для учебной демонстрации, потому что результат можно показать в виде дендрограммы.
**Ограничения:**
Предпочитает компактные почти сферические кластеры и может плохо работать с вытянутыми или невыпуклыми структурами.
Использует / Требует
Является (Is A)
Иерархические алгоритмы
Использует
Расстояние между точками (Евклидово)
Оценивается метрикой
Скорректированный индекс Рэнда
Оценивается метрикой
Индекс Калински-Харабаша
Оценивается метрикой
Индекс Дэвиса-Болдина
Оценивается метрикой
Коэффициент силуэта
Имеет параметр
Порог расстояния (Threshold)
Имеет параметр
Число кластеров (k)
Решает прикладную задачу
Выделение множества микро-кластеров
Имеет масштабируемость
Высокая масштабируемость
Имеет тип логического вывода
Трансдуктивный вывод