Теория

Метод Уорда

Algo_Ward

<h2>Идея метода</h2> <p>Метод Уорда — агломеративный иерархический метод, который выбирает объединение не просто по ближайшей паре точек, а по тому, насколько объединение увеличит внутрикластерную сумму квадратов. Он близок по духу к K-Means: оба метода любят компактные группы и работают с идеей внутрикластерного разброса.</p> <h2>Стоимость объединения</h2> <p>Если у кластеров $A$ и $B$ размеры $|A|$, $|B|$, а их центроиды равны $\mu_A$ и $\mu_B$, то увеличение критерия можно записать так:</p> <p>$$\Delta(A,B)=\frac{|A||B|}{|A|+|B|}\|\mu_A-\mu_B\|^2.$$</p> <p>Алгоритм объединяет ту пару кластеров, для которой $\Delta$ минимально.</p> <h2>Когда метод хорош</h2> <p>Метод Уорда часто дает понятные компактные кластеры и хорошо подходит для числовых признаков после масштабирования. Он особенно полезен, когда нужно получить иерархию, но при этом сохранить связь с критерием компактности.</p> <h2>Ограничения</h2> <p>Метод чувствителен к масштабу признаков и выбросам. Если данные имеют сложную невыпуклую форму, Ward может вести себя похоже на центроидные методы: стремиться к компактным группам, а не к длинным связным областям.</p>