Теория
Внутренние индексы: CH и DB
<h2>Индекс Калински-Харабаша</h2>
<p>Индекс Калински-Харабаша сравнивает разброс между кластерами с разбросом внутри кластеров. Чем больше значение, тем сильнее центры кластеров отделены относительно внутреннего разброса.</p>
<p>На интуитивном уровне он поощряет компактные и хорошо разделенные группы.</p>
<h2>Индекс Дэвиса-Болдина</h2>
<p>Индекс Дэвиса-Болдина оценивает, насколько каждый кластер похож на самый проблемный соседний кластер. Чем меньше значение, тем лучше: внутри кластеров разброс мал, а между центрами расстояние велико.</p>
<h2>Почему метрики могут спорить</h2>
<p>Разные индексы измеряют разные свойства. Один метод может получить лучший силуэт, другой — лучший индекс Калински-Харабаша, третий — более понятные кластеры для предметной области. Поэтому итоговое решение обычно принимают по совокупности: метрики, визуализация, стабильность и смысловая интерпретация.</p>