При запуске случайного леса он не разрешит более 32 уровней в одной переменной, так как в результате получается 2^n комбинаций/разделов данных. Я полагал, что это будет следовать классическому комбинаторному уравнению n!/K! (N-k)! для n выбираем k. Может ли кто-нибудь объяснить, почему это так? Например, если бы у меня было 4 уровня в переменной, они разбивались на 2^4 = 16, где я мог бы предположить, что это должно быть 16/4 = 4.Что делает рекурсивное разбиение на разделы 2^n комбинаций из n уровней данных?
Я подозреваю, что это связано с рекурсивным разделением, происходящим внутри деревьев решений, которые составляют более крупный случайный лес.
Какое программное обеспечение вы используете и какую ошибку вы видите? Ваш вопрос непонятен. – BadZen
Извините, дайте мне знать, как я могу уточнить! Я использую R для создания прогностической модели. Ошибка заключается в том, что модель будет работать невероятно долго или, скорее, закончится из памяти произвольного доступа. Мой вопрос пытается понять теоретическую математику/информатику за рекурсивным разделением с большими уровнями данных в одной переменной. – barker
Пожалуйста, укажите код. Существует не теоретическая причина, почему алгоритм, определенный для всех 'n', имел бы бит-ограниченный размер ввода. Это деталь реализации. Вам нужно показать реализацию или то, что вы пытаетесь запустить. – BadZen