Параметр
Размер пакета (Batch Size)
Параметр для потоковых версий алгоритмов (например, *MiniBatch K-Means*). Задает количество случайно отбираемых объектов из огромной выборки, которые обрабатываются за одну мини-итерацию.
**Суть оптимизации:**
Вместо того чтобы на каждом шаге считать расстояние от *каждого* центроида до *миллиона* точек (что требует $O(N \cdot K)$ операций), алгоритм берет пакет, например, из 100 точек, и сдвигает центроиды только относительно них. Это дает колоссальный прирост скорости при минимальной потере качества.