Параметр
Параметры
Управляющие переменные (гиперпараметры) алгоритма, значения которых исследователь должен зафиксировать **до** начала процедуры обучения.
**Роль в задаче кластеризации (по Б.Г. Миркину):**
Поскольку задача кластеризации формально некорректна (не имеет единственного решения), параметры служат способом введения **априорных знаний** или ограничений на искомую структуру:
* Мы *ожидаем* увидеть 3 группы $\rightarrow$ задаем $k=3$.
* Мы *считаем* близкими объекты на расстоянии 0.5 метра $\rightarrow$ задаем $\epsilon=0.5$.
**Типичные ошибки:**
Неверный подбор параметров может привести к тривиальным решениям:
* Один гигантский кластер, объединяющий всё.
* Каждая точка — отдельный кластер (переобучение).
Использует / Требует
Используется в
Число кластеров (k)
как Является (Is A)
Порог расстояния (Threshold)
как Является (Is A)
Размер окрестности ($\epsilon$)
как Является (Is A)
Мин. объектов (MinPts)
как Является (Is A)
Размер пакета (Batch Size)
как Является (Is A)
Фактор ветвления
как Является (Is A)
Коэффициент затухания (Damping)
как Является (Is A)
Ширина окна (Bandwidth)
как Является (Is A)