Теория
Spectral Clustering: кластеризация через граф
<h2>Переход от точек к графу</h2>
<p>Спектральная кластеризация строит граф похожести: объекты становятся вершинами, а ребра показывают, насколько объекты близки. Чем сильнее похожи две точки, тем больше вес ребра между ними.</p>
<p>Часто похожесть задают через RBF-ядро:</p>
<p>$$w_{ij}=\exp(-\gamma\|x_i-x_j\|^2).$$</p>
<h2>Зачем нужен граф</h2>
<p>Граф позволяет находить группы не только по близости к центрам, но и по связности. Поэтому спектральный подход полезен для колец, лун и других форм, где обычное центроидное разбиение может ошибаться.</p>
<h2>Общая схема</h2>
<ol>
<li>Построить матрицу похожести между объектами.</li>
<li>Построить графовый лапласиан.</li>
<li>Получить спектральное вложение через собственные векторы.</li>
<li>Кластеризовать точки уже в новом пространстве, часто с помощью K-Means.</li>
</ol>
<p>В модуле важно понять идею: иногда сначала нужно изменить представление данных, и только потом применять обычный алгоритм разбиения.</p>