Теория

ФОРЭЛЬ: движущийся кластер

Algo_FOREL
<h2>Идея движущейся сферы</h2> <p>ФОРЭЛЬ — плотностный эвристический алгоритм, который ищет локальные скопления через шар фиксированного радиуса. В двумерном случае удобно думать о круге радиуса \(R\), который передвигается по данным.</p> <h2>Как работает один шаг</h2> <ol> <li>Выбирается начальный центр, часто одна из еще не распределенных точек.</li> <li>Берутся все точки, попавшие в шар радиуса \(R\).</li> <li>Центр шара переносится в среднее положение выбранных точек.</li> <li>Шаги повторяются, пока центр почти не перестает двигаться.</li> <li>Найденные точки образуют кластер и удаляются из дальнейшего рассмотрения.</li> </ol> <p>Если \(S_R(c)\) — множество точек внутри радиуса \(R\) от центра \(c\), то новый центр можно записать так:</p> <p>$$c_{new}=\frac{1}{|S_R(c)|}\sum_{x_i \in S_R(c)} x_i.$$</p> <h2>Что контролирует радиус</h2> <p>Радиус \(R\) определяет масштаб искомых групп. Малый радиус выделяет больше локальных и мелких кластеров. Большой радиус может объединять близкие скопления.</p> <h2>Чем ФОРЭЛЬ отличается от K-Means и DBSCAN</h2> <p>В отличие от K-Means, число кластеров не задается заранее. В отличие от DBSCAN, кластер строится не цепочкой достижимости, а через стабилизацию движущейся области. Поэтому результат может зависеть от порядка выбора начальных точек и выбранного радиуса.</p> <h2>Какую роль метод играет в модуле</h2> <p>ФОРЭЛЬ нужен здесь как классический радиусный пример: студент видит, что кластер можно получать не только через центроиды или плотностную связность, но и через локальную область, которая сдвигается к центру найденного скопления.</p>