Алгоритм
Модельные алгоритмы
Семейство методов, рассматривающих кластеризацию как задачу восстановления плотности распределения вероятностей.
**Гипотеза:** Наблюдаемые данные $X$ являются случайной выборкой из смеси нескольких вероятностных распределений (компонент смеси), каждое из которых соответствует кластеру.
**Ключевые особенности:**
1. **Максимизация правдоподобия:** Цель — найти такие параметры распределений (средние $\mu_k$, дисперсии $\Sigma_k$), которые максимизируют вероятность появления именно такой выборки данных.
2. **EM-алгоритм (Expectation-Maximization):** Итеративный метод решения.
* *E-step:* Оценка вероятности принадлежности точки кластеру.
* *M-step:* Пересчет параметров распределений.
3. **Мягкая кластеризация (Soft Clustering):** Результат — не метка класса, а вектор вероятностей (например, «точка на 80% в кластере А и на 20% в кластере Б»).