Теория

Формула Ланса-Уильямса

HierarchicalAlgorithm
<h2>Зачем нужна формула пересчета</h2> <p>После объединения кластеров \(A\) и \(B\) нужно быстро найти расстояние от нового кластера \(A\cup B\) до любого другого кластера \(C\). Многие агломеративные методы можно записать через общую формулу пересчета расстояний.</p> <p>Один из распространенных вариантов записи:</p> <p>$$d(A\cup B,C)=\alpha_A d(A,C)+\alpha_B d(B,C)+\beta d(A,B)+\gamma |d(A,C)-d(B,C)|.$$</p> <p>Разные значения коэффициентов дают разные linkage-критерии. Поэтому формула удобна как общий язык для описания агломеративных методов.</p> <h2>Интуитивный смысл</h2> <p>Формула показывает, что расстояние до нового кластера можно получить из уже известных расстояний: до \(A\), до \(B\), между \(A\) и \(B\), а иногда и из разницы расстояний до \(C\). Это позволяет не пересчитывать все попарные расстояния с нуля.</p> <h2>Почему это важно для понимания</h2> <p>Студенту не нужно заучивать все коэффициенты. Важно увидеть, что single, complete, average и Ward — не случайные отдельные рецепты, а разные правила обновления одной и той же иерархической процедуры.</p>