Теория
ФОРЭЛЬ: движущийся кластер
<h2>Идея движущейся сферы</h2>
<p>ФОРЭЛЬ — плотностный эвристический алгоритм, который ищет локальные скопления через шар фиксированного радиуса. В двумерном случае удобно думать о круге радиуса \(R\), который передвигается по данным.</p>
<h2>Как работает один шаг</h2>
<ol>
<li>Выбирается начальный центр, часто одна из еще не распределенных точек.</li>
<li>Берутся все точки, попавшие в шар радиуса \(R\).</li>
<li>Центр шара переносится в среднее положение выбранных точек.</li>
<li>Шаги повторяются, пока центр почти не перестает двигаться.</li>
<li>Найденные точки образуют кластер и удаляются из дальнейшего рассмотрения.</li>
</ol>
<p>Если \(S_R(c)\) — множество точек внутри радиуса \(R\) от центра \(c\), то новый центр можно записать так:</p>
<p>$$c_{new}=\frac{1}{|S_R(c)|}\sum_{x_i \in S_R(c)} x_i.$$</p>
<h2>Что контролирует радиус</h2>
<p>Радиус \(R\) определяет масштаб искомых групп. Малый радиус выделяет больше локальных и мелких кластеров. Большой радиус может объединять близкие скопления.</p>
<h2>Чем ФОРЭЛЬ отличается от K-Means и DBSCAN</h2>
<p>В отличие от K-Means, число кластеров не задается заранее. В отличие от DBSCAN, кластер строится не цепочкой достижимости, а через стабилизацию движущейся области. Поэтому результат может зависеть от порядка выбора начальных точек и выбранного радиуса.</p>
<h2>Какую роль метод играет в модуле</h2>
<p>ФОРЭЛЬ нужен здесь как классический радиусный пример: студент видит, что кластер можно получать не только через центроиды или плотностную связность, но и через локальную область, которая сдвигается к центру найденного скопления.</p>