Я только начал работать с Weka, и я не могу понять, когда мои деревья решений слишком глубоки. У меня есть набор из 423 функций, которые, насколько я знаю, случайным образом выбираются для каждой цели. Таким образом, эти подмножества функций генерируют ветви или потоки с листьями решений, которые, как представляется, не являются общими, на самом деле они слишком специфичны, поскольку они применяются только к одному или двум случаям всех случаев в корпусе, например, no (2/0), да (1/0). Я считаю, что это не обобщение хорошо, и, возможно, это связано с тем, что деревья решений слишком глубокие. Итак, мой вопрос, который должен быть maxDepth дерева? Как узнать, когда дерево слишком глубокое? Я пробовал, но менял maxDepth на 10, и все же листья содержат решения, основанные на нескольких случаях. Кроме того, по умолчанию Weka генерирует 10 деревьев, и я задаюсь вопросом, приведет ли установка большего количества деревьев к лучшим результатам. Я читал, что случайный лес хорошо работает с 100 300 или даже 500 деревьями, хотя я не знаю, будет ли это работать для набора из 423 функций. Наконец, я хотел бы знать, что означает «1» в этом решении: «нет (632/1)». Означает ли это, что 632 были правильно классифицированы как «нет», но один был классифицирован как «да», хотя это было «нет»? Является ли это «1» ложным положительным? Спасибо за помощь!WEKA - RandomForest, как узнать, когда дерево слишком глубокое?
0
A
ответ
1
Лучшее, что можно попробовать в таком сценарии, - это выполнить поиск по сетке по параметрам. Таким образом, вы можете определить метрику производительности и узнать ее значение для разных параметров. Это будет полезно для определения оптимальной настройки параметров. Также попробуйте рассчитать этот показатель производительности в наборе проверки, а не в наборе обучения.
Смежные вопросы
- 1. Классификация Randomforest weka
- 2. RandomForest с Weka в Java
- 3. Точная реализация RandomForest в Weka 3.7
- 4. Измерение JSON слишком глубокое
- 5. Как построить дерево randomforest (рейнджер) в Caret
- 6. Как узнать, когда слишком много соединений SQL?
- 7. Почему Weka RandomForest дает мне отличный результат, чем Scikit RandomForestClassifier?
- 8. Решение Weka J-48 Дерево, не заполняющее
- 9. Как узнать дерево зависимостей Maven
- 10. Как вы визуализируете дерево в ID3 с помощью weka?
- 11. Как узнать, когда ul слишком мал для li
- 12. Почему дерево решений работает не так, как ожидалось в WEKA?
- 13. Как узнать дерево strucuture большого файла xml
- 14. Лучший способ построить глубокое дерево из результатов MySQL?
- 15. tree.RandomForestExt классификатор и переменная важности в Weka
- 16. Weka: Ограничения на то, что можно выводить как источник?
- 17. Как пробовать строки в пакете randomForest
- 18. R: дополнительная случайность в randomForest?
- 19. Как узнать, когда UILabel wordwraps
- 20. Как узнать, получил ли я хороший результат Weka
- 21. Как узнать «поддержку» правил каждой ассоциации в Weka?
- 22. Как десериализовать сохраненную модель в Weka-for-Android
- 23. Какой критерий разбиения используется случайное дерево в Weka 3.7.11 для численных атрибутов?
- 24. Weka Logistic IndexOutOfBoundsException
- 25. Основные данные: Экспрессия дерево слишком большой
- 26. Модификация J48 алгоритма в Weka
- 27. Дерево Kd для треугольных сеток слишком медленно
- 28. Дерево решений WEKA J48 с нелинейно разделяемыми данными
- 29. Как пройти проверку модели RandomForest?
- 30. Weka - Как проверить, есть ли переоформление в weka?