Теория

Как читать дендрограмму

HierarchicalAlgorithm
<h2>Что показывает дендрограмма</h2> <p>Дендрограмма — это визуальная запись истории объединения кластеров. Внизу обычно находятся отдельные объекты, выше — объединения, а вертикальная высота показывает расстояние или стоимость объединения.</p> <h2>Как выбирать число кластеров</h2> <p>Чтобы получить обычное разбиение из иерархии, дендрограмму мысленно разрезают горизонтальной линией. Сколько вертикальных ветвей пересекает линия, столько кластеров получается на этом уровне.</p> <p>Часто выбирают уровень перед большим скачком высоты: если следующее объединение происходит намного выше предыдущих, значит алгоритм собирается объединить уже достаточно разные группы.</p> <h2>Что важно не перепутать</h2> <ul> <li>Порядок листьев слева направо не является шкалой расстояния между соседними объектами.</li> <li>Высота объединения важнее горизонтального положения ветвей.</li> <li>Разные linkage-критерии могут дать разные дендрограммы на одних и тех же данных.</li> <li>Дендрограмма помогает выбрать уровень детализации, но не заменяет интерпретацию кластеров.</li> </ul>