Понятие

Согласованность с эталонным разбиением

Критерий качества, при котором результат кластеризации сравнивается с заранее известной правильной разметкой объектов. **Смысл критерия:** Если для набора данных известны истинные метки классов, можно проверить, насколько найденные кластеры совпадают с эталонной структурой. При этом номера кластеров сами по себе не важны: важно, какие пары объектов оказались вместе или раздельно. **Парная логика:** Для пары объектов $(x_i, x_j)$ сравнивается два факта: 1. находятся ли они в одном классе в эталонной разметке; 2. находятся ли они в одном кластере в результате алгоритма. Если эти решения совпадают для большого числа пар, кластеризация считается согласованной с эталоном. На этом принципе основаны Rand Index и Adjusted Rand Index.