Теория

Выбор K: elbow и силуэт

QMetric_SilhouetteScore
<h2>Почему одной инерции мало</h2> <p>Инерция K-Means почти всегда уменьшается при увеличении числа кластеров \(K\): чем больше центроидов, тем легче приблизить точки. Поэтому минимальная инерция сама по себе не говорит, что выбранное \(K\) является содержательно лучшим.</p> <h2>Метод локтя</h2> <p>Метод локтя смотрит на график инерции при разных \(K\). Если после некоторого значения улучшение становится заметно слабее, это значение рассматривают как разумный компромисс между простотой и компактностью.</p> <h2>Силуэт как дополнительная проверка</h2> <p>Силуэт оценивает, насколько объекты близки к своему кластеру и далеко от ближайшего чужого. Поэтому он помогает проверить не только компактность вокруг центроидов, но и отделенность групп.</p> <p>На практике полезно смотреть оба сигнала: elbow показывает, где инерция перестает резко падать, а силуэт помогает понять, не стало ли разбиение формальным и плохо отделенным.</p>