Теория

Внутренние индексы: CH и DB

InternalQualityMetric
<h2>Индекс Калински-Харабаша</h2> <p>Индекс Калински-Харабаша сравнивает разброс между кластерами с разбросом внутри кластеров. Чем больше значение, тем сильнее центры кластеров отделены относительно внутреннего разброса.</p> <p>На интуитивном уровне он поощряет компактные и хорошо разделенные группы.</p> <h2>Индекс Дэвиса-Болдина</h2> <p>Индекс Дэвиса-Болдина оценивает, насколько каждый кластер похож на самый проблемный соседний кластер. Чем меньше значение, тем лучше: внутри кластеров разброс мал, а между центрами расстояние велико.</p> <h2>Почему метрики могут спорить</h2> <p>Разные индексы измеряют разные свойства. Один метод может получить лучший силуэт, другой — лучший индекс Калински-Харабаша, третий — более понятные кластеры для предметной области. Поэтому итоговое решение обычно принимают по совокупности: метрики, визуализация, стабильность и смысловая интерпретация.</p>