Параметр

Параметры

Управляющие переменные (гиперпараметры) алгоритма, значения которых исследователь должен зафиксировать **до** начала процедуры обучения. **Роль в задаче кластеризации (по Б.Г. Миркину):** Поскольку задача кластеризации формально некорректна (не имеет единственного решения), параметры служат способом введения **априорных знаний** или ограничений на искомую структуру: * Мы *ожидаем* увидеть 3 группы $\rightarrow$ задаем $k=3$. * Мы *считаем* близкими объекты на расстоянии 0.5 метра $\rightarrow$ задаем $\epsilon=0.5$. **Типичные ошибки:** Неверный подбор параметров может привести к тривиальным решениям: * Один гигантский кластер, объединяющий всё. * Каждая точка — отдельный кластер (переобучение).