Алгоритм

Модельные алгоритмы

Семейство методов, рассматривающих кластеризацию как задачу восстановления плотности распределения вероятностей. **Гипотеза:** Наблюдаемые данные $X$ являются случайной выборкой из смеси нескольких вероятностных распределений (компонент смеси), каждое из которых соответствует кластеру. **Ключевые особенности:** 1. **Максимизация правдоподобия:** Цель — найти такие параметры распределений (средние $\mu_k$, дисперсии $\Sigma_k$), которые максимизируют вероятность появления именно такой выборки данных. 2. **EM-алгоритм (Expectation-Maximization):** Итеративный метод решения. * *E-step:* Оценка вероятности принадлежности точки кластеру. * *M-step:* Пересчет параметров распределений. 3. **Мягкая кластеризация (Soft Clustering):** Результат — не метка класса, а вектор вероятностей (например, «точка на 80% в кластере А и на 20% в кластере Б»).