Теория

Spectral Clustering: кластеризация через граф

Algo_SpectralClustering
<h2>Переход от точек к графу</h2> <p>Спектральная кластеризация строит граф похожести: объекты становятся вершинами, а ребра показывают, насколько объекты близки. Чем сильнее похожи две точки, тем больше вес ребра между ними.</p> <p>Часто похожесть задают через RBF-ядро:</p> <p>$$w_{ij}=\exp(-\gamma\|x_i-x_j\|^2).$$</p> <h2>Зачем нужен граф</h2> <p>Граф позволяет находить группы не только по близости к центрам, но и по связности. Поэтому спектральный подход полезен для колец, лун и других форм, где обычное центроидное разбиение может ошибаться.</p> <h2>Общая схема</h2> <ol> <li>Построить матрицу похожести между объектами.</li> <li>Построить графовый лапласиан.</li> <li>Получить спектральное вложение через собственные векторы.</li> <li>Кластеризовать точки уже в новом пространстве, часто с помощью K-Means.</li> </ol> <p>В модуле важно понять идею: иногда сначала нужно изменить представление данных, и только потом применять обычный алгоритм разбиения.</p>