Понятие
Применение (Use case)
Типовая бизнес-задача или задача анализа данных (Data Mining), для решения которой математические свойства конкретного алгоритма подходят наилучшим образом.
**Основные сценарии применения (из введения Б.Г. Миркина):**
1. **Структуризация данных (General-purpose):** Выделение типичных профилей (например, сегментация клиентов банка). Важна хорошая интерпретируемость центроидов (K-Means).
2. **Поиск аномалий (Outlier Removal):** Выявление нетипичных объектов, мошенничества или технического брака. Требует методов, способных изолировать шум, а не втягивать его в ближайший кластер (DBSCAN, OPTICS).
3. **Сокращение размерности / Векторное квантование (Data Reduction):** Замена миллионов сырых объектов небольшим набором "микро-кластеров" для ускорения последующего обучения тяжелых нейросетей (BIRCH).
4. **Оценка плотности вероятности (Density Estimation):** Построение генеративной модели для генерации новых похожих данных (Gaussian Mixtures).