Метрика

Скорректированный индекс Рэнда

Внешняя метрика качества, сравнивающая предсказанное разбиение с эталонной кластеризацией. Скорректированный индекс Рэнда был предложен Хьюбертом и Араби как вариант Rand Index с поправкой на случайные совпадения. **Формула:** $ARI = \frac{RI - E[RI]}{\max(RI) - E[RI]}$, где $RI$ — индекс Рэнда, $E[RI]$ — ожидаемое значение индекса при случайном разбиении. **Ключевая особенность:** Индекс скорректирован на случайное совпадение: * значение 0 соответствует случайному угадыванию; * значение 1 соответствует полному совпадению с эталоном. * отрицательные значения возможны, если разбиение хуже случайного ожидания. **Педагогическая ценность:** Полезен в учебных экспериментах, когда студенту нужно сравнить результат алгоритма с заранее известной правильной разметкой.