Понятие
OPTICS
OPTICS (Ordering Points To Identify the Clustering Structure) — плотностной алгоритм, предложенный М. Анкерстом и соавторами как развитие идеи DBSCAN.
**Основная идея:**
Вместо построения одного разбиения при фиксированном $\epsilon$ алгоритм формирует специальный порядок обхода объектов. Для каждой точки вычисляется reachability distance — расстояние достижимости, показывающее, насколько легко точка присоединяется к плотностной области.
**Reachability plot:**
Результат часто анализируется через график достижимости. Долины на таком графике соответствуют плотным кластерам, а высокие участки — переходам между ними или шуму.
**Преимущества:**
OPTICS лучше DBSCAN показывает структуру данных при переменной плотности и помогает исследователю увидеть несколько возможных уровней разбиения.
**Ограничения:**
Алгоритм не всегда сразу возвращает одно простое разбиение: часто требуется интерпретировать reachability plot или использовать дополнительную процедуру извлечения кластеров.
Использует / Требует
Оценивается метрикой
Скорректированный индекс Рэнда
Имеет масштабируемость
Высокая масштабируемость
Предполагает размер кластеров
Неравномерные размеры
Поддерживает геометрию
Произвольная (сложная) геометрия
Оценивается метрикой
Коэффициент силуэта
Имеет тип логического вывода
Трансдуктивный вывод
Имеет параметр
Мин. объектов (MinPts)
Решает прикладную задачу
Поиск аномалий и удаление шума
Использует
Расстояние между точками (Евклидово)
Является (Is A)
Плотностные алгоритмы