Я использую данные по широте и долготе, а также данные Landsat в качестве предсказателей в моей случайной модели леса, целью которой является предсказать присутствие или отсутствие черных елей в ландшафте. Широта отображается как имеющая большое значение, и вы можете увидеть влияние резких линий широты в прогнозируемых прогнозах. Кроме того, используя tunerF, mtry оптимизирован только для 2-х предикторов, причем одним из них является широта. Подходит ли моя модель?Может ли предиктор в случайном лесу привести к недоустройству?
1
A
ответ
1
Выбор mtry = 2, не означает, что вы полностью отбрасываете третий параметр. На самом деле, наоборот. Вы должны в начале включить все разумные предиктора в обучение модели РФ. Понижение mtry позволит тестировать в каждом узле меньше, чем все переменные. Это позволяет менее доминирующим переменным вносить больший вклад в окончательное предсказание. Низкий mtry аналогичен регрессии (регуляризованной). Регуляризация увеличивает смещение, но снижает дисперсию. Иногда грубые и надежные просто лучше, иногда нет. Вы бы поняли, перекрестная проверка.
Похоже, у вас есть ~ 500 выборок (много) и только 3-6 переменных (несколько). Я начинал бы ленивый и просто менял mtry вручную на все значения 3-6 и смотрел на возвращаемое значение OOB-CV.
Смежные вопросы
- 1. ValueError в случайном лесу (Python)
- 2. Запрос о выборе переменной в случайном лесу
- 3. Что такое PermutedVarDeltaError в случайном лесу?
- 4. Что случилось с ошибкой в случайном лесу?
- 5. Как сгенерировать файловый дескриптор в случайном лесу?
- 6. Что делает семя в случайном лесу?
- 7. Сведения о деревьях в случайном лесу
- 8. Ошибка в «случайном лесу» из пакета Caret
- 9. Как указать классификацию в h2o случайном лесу
- 10. Как настроить собственный вероятностный порог в случайном лесу?
- 11. Двоичная классификация или неизвестный класс в случайном лесу в R
- 12. Как определить количество узлов в случайном лесу в R
- 13. Может ли jAlert привести к любой ссылке?
- 14. Может ли Application.terminate привести к утечке памяти?
- 15. Может ли кастинг привести к проблеме?
- 16. Может ли Array.splice привести к утечке памяти?
- 17. Может ли операция INSERT привести к взаимоблокировке?
- 18. Может ли `recv()` привести к переполнению буфера?
- 19. Может ли код назначения привести к сбою?
- 20. Как остановить случайную выборку в случайном лесу с помощью OpenCV?
- 21. Как распечатать функции после моделирования в случайном лесу?
- 22. Рекурсивное устранение функции в случайном лесу с использованием scikit-learn
- 23. Определить количество деревьев в случайном лесу с помощью python
- 24. Найти важные функции в случайном лесу очень медленно
- 25. Как получить прогностические атрибуты каждой цели в «Случайном лесу»?
- 26. Как решить переобучение в случайном лесу Python sklearn?
- 27. Оценка положения головы на случайном лесу в бумаге G Fanelli
- 28. Что означает параметр «verbosity» в случайном лесу? (sklearn)
- 29. SMOTE не работает в случайном лесу для удержания образца
- 30. Как использовать значение функции Spark в случайном лесу?
Наверное, следует спросить здесь: http://stats.stackexchange.com/questions/tagged/r –