Теория
Метод Уорда
<h2>Идея метода</h2>
<p>Метод Уорда — агломеративный иерархический метод, который выбирает объединение не просто по ближайшей паре точек, а по тому, насколько объединение увеличит внутрикластерную сумму квадратов. Он близок по духу к K-Means: оба метода любят компактные группы и работают с идеей внутрикластерного разброса.</p>
<h2>Стоимость объединения</h2>
<p>Если у кластеров \(A\) и \(B\) размеры \(|A|\), \(|B|\), а их центроиды равны \(\mu_A\) и \(\mu_B\), то увеличение критерия можно записать так:</p>
<p>$$\Delta(A,B)=\frac{|A||B|}{|A|+|B|}\|\mu_A-\mu_B\|^2.$$</p>
<p>Алгоритм объединяет ту пару кластеров, для которой \(\Delta\) минимально.</p>
<h2>Когда метод хорош</h2>
<p>Метод Уорда часто дает понятные компактные кластеры и хорошо подходит для числовых признаков после масштабирования. Он особенно полезен, когда нужно получить иерархию, но при этом сохранить связь с критерием компактности.</p>
<h2>Ограничения</h2>
<p>Метод чувствителен к масштабу признаков и выбросам. Если данные имеют сложную невыпуклую форму, Ward может вести себя похоже на центроидные методы: стремиться к компактным группам, а не к длинным связным областям.</p>