Я написал код в python для реализации алгоритма кластеризации DBSCAN. Мой набор данных состоит из пользователей 14k с каждым пользователем, представленным 10 функциями. Я не могу решить, что именно сохранить в качестве значения Min_samples и epsilon в качестве входных данных Как мне это решить? Мера сходства - это евклидово расстояние. (Отсюда становится еще труднее решать.) Любые указатели?Определение входных значений алгоритму DBSCAN
0
A
ответ
0
DBSCAN довольно часто трудно оценить его параметры.
Вы думаете об алгоритме OPTICS? В этом случае вам понадобятся только Min_samples, которые соответствуют минимальному размеру кластера.
В противном случае для DBSCAN я делал это в прошлом методом проб и ошибок: попробуйте некоторые значения и посмотрите, что произойдет. Следующее правило состоит в том, что если ваш набор данных шумный, вы должны иметь большее значение, и оно также коррелирует с количеством измерений (в этом случае 10).
Смежные вопросы
- 1. определение круга по алгоритму
- 2. Определение параметров DBSCAN Algo для кластеризации Tweet
- 3. Определение входных значений, для которых функция не генерирует определенный вывод
- 4. Получение набора входных значений
- 5. число входных значений меняется
- 6. Сравнение входных значений пользователя
- 7. Расчет зависимых входных значений
- 8. Проверка наличия входных значений
- 9. Предотвращение изменений входных значений
- 10. Сравнение входных значений формы
- 11. Заменить несколько входных значений
- 12. Определение значения атрибута sciskit DBSCAN eps и min_sample
- 13. Добавление входных значений и значений по умолчанию
- 14. Установить несколько значений словаря из входных значений?
- 15. Rails Сортировка по алгоритму
- 16. Установка входных значений в нуль
- 17. Логика общей суммы входных значений
- 18. Суммирование нескольких значений входных данных
- 19. Angular2 ang получение входных значений
- 20. printf не дает входных значений
- 21. Получение всех входных значений запроса
- 22. noUiSlider: настройка округленных входных значений
- 23. Добавление значений выбранных входных меню
- 24. JQuery toggleClass на входных значений
- 25. Загрузка страницы и входных значений
- 26. Обработка входных значений формы math.pow
- 27. Найти два наименьших входных значений
- 28. Получение входных значений без переопределения
- 29. JQuery - Передача входных значений радиокнопке
- 30. Изменение табличных и входных значений?
Оцените эвклидову расстояние по вашему набору данных. Это работает? Что такое разумный порог подобия? Затем используйте этот порог как epsilon для DBSCAN. –
Как оценить эвклидовое расстояние на моем наборе данных? – Maxwell
@ Anony-Mousse: Я думал об этом: имеет ли смысл нормализовать евклидовы расстояния в пределах 0-1. Теперь расстояния могут увеличиться до примерно 10k +, что затрудняет определение порога. Но я не уверен, как его нормализовать. Есть идеи? – Maxwell