Теория
Когда выбирать методы пятого модуля
<h2>Как выбирать метод</h2>
<p>Методы пятого модуля показывают, что кластеризация может быть не только центроидной, плотностной или иерархической. Иногда полезнее описывать данные вероятностно, строить граф похожести, искать реальные представители или сжимать поток точек в микрокластеры.</p>
<ul>
<li><strong>GMM</strong> — когда нужны мягкие вероятности и эллиптические компоненты.</li>
<li><strong>Spectral Clustering</strong> — когда важна связность и сложная форма данных.</li>
<li><strong>Affinity Propagation</strong> — когда нужны реальные представители кластеров и число групп не задано заранее.</li>
<li><strong>BIRCH</strong> — когда данных много и нужно сначала сжать их в микрокластеры.</li>
</ul>
<h2>Общее ограничение</h2>
<p>Эти методы сильнее, но не универсальны. GMM зависит от предположений о распределении, spectral и affinity часто требуют матрицу похожести, BIRCH зависит от порога микрокластера. Поэтому выбор метода всегда связан с формой данных, масштабом выборки и целью анализа.</p>