2014-11-05 3 views
0

Обычно я использую реализацию Vector Vector Machines, предоставляемую пакетом R e1071. Недавно мне нужно было сохранить обученные модели, чтобы использовать их позже в другой функции, поэтому я попытался с помощью команды save. Сохранение модели заняло около 2-3 минут, генерируя файлы объемом 400 МБ! Я был удивлен, потому что структура данных в моей рабочей области была довольно маленькой (< 50 KB). Я обучаю регрессионные SVM с двумя входами с менее чем 1000 выборками, поэтому я не ожидал наличия больших сохраненных файлов. Даже проверка структуры с помощью dput не помогла мне найти проблему.Огромные файлы при сохранении SVM-моделей с e1071

ответ

0

Я попытался сохранить модели с помощью команды dump, но я понял, что команда не смогла сохранить атрибуты. Я проверил список атрибутов, и я нашел этот атрибут поля `терминов:

$.Environment 
<environment: 0x2bd1c00> 

я понял, что модель SVM имеет„связь“с окружающей средой, когда она была создана, и в самом деле, после проверки , Я обнаружил, что когда я создаю модели SVM с помощью команды svm, рабочая область содержит некоторые очень большие кадры данных. Таким образом, решение легко: просто удалите все ненужные структуры данных, прежде чем возвращать/сохранять вашу SVM-модель, чтобы избежать огромных сохраненных файлов данных.

Смежные вопросы