Теория
Как читать дендрограмму
<h2>Что показывает дендрограмма</h2>
<p>Дендрограмма — это визуальная запись истории объединения кластеров. Внизу обычно находятся отдельные объекты, выше — объединения, а вертикальная высота показывает расстояние или стоимость объединения.</p>
<h2>Как выбирать число кластеров</h2>
<p>Чтобы получить обычное разбиение из иерархии, дендрограмму мысленно разрезают горизонтальной линией. Сколько вертикальных ветвей пересекает линия, столько кластеров получается на этом уровне.</p>
<p>Часто выбирают уровень перед большим скачком высоты: если следующее объединение происходит намного выше предыдущих, значит алгоритм собирается объединить уже достаточно разные группы.</p>
<h2>Что важно не перепутать</h2>
<ul>
<li>Порядок листьев слева направо не является шкалой расстояния между соседними объектами.</li>
<li>Высота объединения важнее горизонтального положения ветвей.</li>
<li>Разные linkage-критерии могут дать разные дендрограммы на одних и тех же данных.</li>
<li>Дендрограмма помогает выбрать уровень детализации, но не заменяет интерпретацию кластеров.</li>
</ul>