2015-07-17 2 views
1

Можно ли удалить данные с установленной модели GBM? Я знаю опцию keep.data. Тем не менее, я хотел бы иметь возможность хранить данные во время обработки, но затем уменьшать их. Кроме того, если я хочу сохранить только одно дерево для будущих прогнозов (скажем, после установки 1000 деревьев, я решил, что 500 деревьев работают лучше всего в моем случае, поэтому я хотел бы сохранить только это дерево. Есть ли безопасный способ для удаления избыточных данных из подобранной модели без ущерба для способности предсказывать новые данные?Можно ли уменьшить модель GBM в R?

+0

Это не вопрос статистики, а скорее конкретная реализация алгоритма в R –

ответ

0

Я думаю, что единственный действительно полезный способ сделать это, чтобы удалить лишние деревья, как вы предлагаете.

Если я запускаю следующее на примере gbm я получаю, что деревья составляют 80% от размера объекта, а данные 10%. Таким образом, удаление лишних деревьев может сэкономить много места.

library(pryr) 
bit <- unlist(lapply(gbm1,object_size)) 
round(bit/sum(bit),3) 

Вы также можете попробовать сжать объект, что значительно уменьшит его размер.

memCompress(serialize(gbm1, NULL), "bzip2") 
unserialize(memDecompress(gbm1, type = "bzip2"))