Понятие

Применение (Use case)

Типовая бизнес-задача или задача анализа данных (Data Mining), для решения которой математические свойства конкретного алгоритма подходят наилучшим образом. **Основные сценарии применения (из введения Б.Г. Миркина):** 1. **Структуризация данных (General-purpose):** Выделение типичных профилей (например, сегментация клиентов банка). Важна хорошая интерпретируемость центроидов (K-Means). 2. **Поиск аномалий (Outlier Removal):** Выявление нетипичных объектов, мошенничества или технического брака. Требует методов, способных изолировать шум, а не втягивать его в ближайший кластер (DBSCAN, OPTICS). 3. **Сокращение размерности / Векторное квантование (Data Reduction):** Замена миллионов сырых объектов небольшим набором "микро-кластеров" для ускорения последующего обучения тяжелых нейросетей (BIRCH). 4. **Оценка плотности вероятности (Density Estimation):** Построение генеративной модели для генерации новых похожих данных (Gaussian Mixtures).

Использует / Требует

Является (Is A) Кластеризация

Используется в

Универсальное применение (Базовый анализ) как Является (Is A) Поиск аномалий и удаление шума как Является (Is A) Оценка плотности распределения как Является (Is A) Векторное квантование (Сокращение данных) как Является (Is A) Выделение множества микро-кластеров как Является (Is A)