Теория

Метод Уорда

Algo_Ward
<h2>Идея метода</h2> <p>Метод Уорда — агломеративный иерархический метод, который выбирает объединение не просто по ближайшей паре точек, а по тому, насколько объединение увеличит внутрикластерную сумму квадратов. Он близок по духу к K-Means: оба метода любят компактные группы и работают с идеей внутрикластерного разброса.</p> <h2>Стоимость объединения</h2> <p>Если у кластеров \(A\) и \(B\) размеры \(|A|\), \(|B|\), а их центроиды равны \(\mu_A\) и \(\mu_B\), то увеличение критерия можно записать так:</p> <p>$$\Delta(A,B)=\frac{|A||B|}{|A|+|B|}\|\mu_A-\mu_B\|^2.$$</p> <p>Алгоритм объединяет ту пару кластеров, для которой \(\Delta\) минимально.</p> <h2>Когда метод хорош</h2> <p>Метод Уорда часто дает понятные компактные кластеры и хорошо подходит для числовых признаков после масштабирования. Он особенно полезен, когда нужно получить иерархию, но при этом сохранить связь с критерием компактности.</p> <h2>Ограничения</h2> <p>Метод чувствителен к масштабу признаков и выбросам. Если данные имеют сложную невыпуклую форму, Ward может вести себя похоже на центроидные методы: стремиться к компактным группам, а не к длинным связным областям.</p>