Теория
Формула Ланса-Уильямса
<h2>Зачем нужна формула пересчета</h2>
<p>После объединения кластеров \(A\) и \(B\) нужно быстро найти расстояние от нового кластера \(A\cup B\) до любого другого кластера \(C\). Многие агломеративные методы можно записать через общую формулу пересчета расстояний.</p>
<p>Один из распространенных вариантов записи:</p>
<p>$$d(A\cup B,C)=\alpha_A d(A,C)+\alpha_B d(B,C)+\beta d(A,B)+\gamma |d(A,C)-d(B,C)|.$$</p>
<p>Разные значения коэффициентов дают разные linkage-критерии. Поэтому формула удобна как общий язык для описания агломеративных методов.</p>
<h2>Интуитивный смысл</h2>
<p>Формула показывает, что расстояние до нового кластера можно получить из уже известных расстояний: до \(A\), до \(B\), между \(A\) и \(B\), а иногда и из разницы расстояний до \(C\). Это позволяет не пересчитывать все попарные расстояния с нуля.</p>
<h2>Почему это важно для понимания</h2>
<p>Студенту не нужно заучивать все коэффициенты. Важно увидеть, что single, complete, average и Ward — не случайные отдельные рецепты, а разные правила обновления одной и той же иерархической процедуры.</p>