Теория
Когда применять иерархические методы
<h2>Сильные стороны</h2>
<p>Иерархическая кластеризация полезна, когда нужно не только получить группы, но и увидеть, как они вложены друг в друга. Она хорошо подходит для исследовательского анализа, небольших и средних выборок, таксономий, группировки документов, биологических объектов и любых случаев, где важна структура уровней.</p>
<h2>Практические преимущества</h2>
<ul>
<li>не нужно заранее выбирать единственное число кластеров;</li>
<li>можно сравнивать разные уровни детализации;</li>
<li>дендрограмма дает понятное объяснение результата;</li>
<li>разные linkage-критерии позволяют менять характер кластеров.</li>
</ul>
<h2>Ограничения</h2>
<p>Агломеративные методы обычно дороже по памяти и времени, чем K-Means. Кроме того, ранние объединения не пересматриваются: если алгоритм неудачно склеил две группы в начале, дальше это решение останется внутри иерархии.</p>
<h2>Как выбирать критерий</h2>
<p>Single linkage подходит, когда важна связность и допустимы вытянутые цепочки. Complete linkage дает более компактные группы. Average linkage является спокойным компромиссом. Ward хорошо подходит для числовых данных, когда нужен критерий компактности и признаки корректно масштабированы.</p>