Понятие
MiniBatch K-Means
MiniBatch K-Means — масштабируемая модификация K-Means, в которой центроиды обновляются не по всей выборке, а по небольшим случайным пакетам объектов.
**Основная идея:**
Обычный K-Means на каждом шаге использует все $n$ объектов. MiniBatch K-Means берет пакет размера $b \ll n$ и обновляет центроиды приближенно. Это снижает стоимость одной итерации с $O(nK)$ до $O(bK)$.
**Обновление центров:**
Центр кластера постепенно сдвигается в сторону объектов мини-пакета, которые были к нему отнесены. Такой процесс напоминает стохастическую оптимизацию.
**Преимущества:**
Метод особенно полезен для больших наборов данных и интерактивных приложений, где пользователь ожидает быстрый результат.
**Ограничения:**
Качество может быть немного ниже, чем у полного K-Means, а результат зависит от размера пакета, порядка данных и числа итераций.
Использует / Требует
Является (Is A)
Алгоритмы разбиения (Partitioning)
Использует
Расстояние между точками (Евклидово)
Расширяет метод
K-Means
Оценивается метрикой
Скорректированный индекс Рэнда
Оценивается метрикой
Индекс Калински-Харабаша
Оценивается метрикой
Индекс Дэвиса-Болдина
Оценивается метрикой
Коэффициент силуэта
Имеет параметр
Число кластеров (k)
Имеет параметр
Размер пакета (Batch Size)
Решает прикладную задачу
Универсальное применение (Базовый анализ)
Поддерживает геометрию
Выпуклая геометрия
Предполагает размер кластеров
Равномерные размеры
Имеет масштабируемость
Высокая масштабируемость
Имеет тип логического вывода
Индуктивный вывод