Метрика
Скорректированный индекс Рэнда
Внешняя метрика качества, сравнивающая предсказанное разбиение с эталонной кластеризацией. Скорректированный индекс Рэнда был предложен Хьюбертом и Араби как вариант Rand Index с поправкой на случайные совпадения.
**Формула:**
$ARI = \frac{RI - E[RI]}{\max(RI) - E[RI]}$,
где $RI$ — индекс Рэнда, $E[RI]$ — ожидаемое значение индекса при случайном разбиении.
**Ключевая особенность:**
Индекс скорректирован на случайное совпадение:
* значение 0 соответствует случайному угадыванию;
* значение 1 соответствует полному совпадению с эталоном.
* отрицательные значения возможны, если разбиение хуже случайного ожидания.
**Педагогическая ценность:**
Полезен в учебных экспериментах, когда студенту нужно сравнить результат алгоритма с заранее известной правильной разметкой.
Использует / Требует
Используется в
K-Means
как Оценивается метрикой
Ward hierarchical clustering
как Оценивается метрикой
DBSCAN
как Оценивается метрикой
HDBSCAN
как Оценивается метрикой
Spectral clustering
как Оценивается метрикой
MiniBatch K-Means
как Оценивается метрикой
BIRCH
как Оценивается метрикой
Affinity propagation
как Оценивается метрикой
Gaussian mixtures
как Оценивается метрикой
Agglomerative clustering
как Оценивается метрикой
Mean-shift
как Оценивается метрикой
Согласованность с эталонным разбиением
как Рекомендуется после
OPTICS
как Оценивается метрикой
Bisecting K-Means
как Оценивается метрикой
Алгоритм Максимина
как Оценивается метрикой
Алгоритм ФОРЭЛЬ
как Оценивается метрикой