Можно ли удалить данные с установленной модели GBM? Я знаю опцию keep.data
. Тем не менее, я хотел бы иметь возможность хранить данные во время обработки, но затем уменьшать их. Кроме того, если я хочу сохранить только одно дерево для будущих прогнозов (скажем, после установки 1000 деревьев, я решил, что 500 деревьев работают лучше всего в моем случае, поэтому я хотел бы сохранить только это дерево. Есть ли безопасный способ для удаления избыточных данных из подобранной модели без ущерба для способности предсказывать новые данные?Можно ли уменьшить модель GBM в R?
1
A
ответ
0
Я думаю, что единственный действительно полезный способ сделать это, чтобы удалить лишние деревья, как вы предлагаете.
Если я запускаю следующее на примере gbm я получаю, что деревья составляют 80% от размера объекта, а данные 10%. Таким образом, удаление лишних деревьев может сэкономить много места.
library(pryr)
bit <- unlist(lapply(gbm1,object_size))
round(bit/sum(bit),3)
Вы также можете попробовать сжать объект, что значительно уменьшит его размер.
memCompress(serialize(gbm1, NULL), "bzip2")
unserialize(memDecompress(gbm1, type = "bzip2"))
Это не вопрос статистики, а скорее конкретная реализация алгоритма в R –