Я создал матрицу tdm в R, которую я хочу записать в файл. Это большая разреженная матрица в простой триплетной форме, ~ 20 000 х 10000. Когда я конвертирую его в плотную матрицу для добавления столбцов с помощью cbind, я получаю небольшие ошибки памяти, и процесс не завершается. Я не хочу увеличивать свою оперативную память.Проблема с большой памятью данных в R
Кроме того, я хочу - - связать ТФ и tfidf матрицу вместе - сохранить редкую/плотную матрицу CSV - работают алгоритмы машинного обучения партии, такие, как осуществление J48 в WEKA.
Как сохранить/загрузить набор данных и запустить пакетные алгоритмы ML в пределах ограничений памяти?
Если я могу написать разреженную матрицу в хранилище данных, могу ли я запустить алгоритмы ml в R на разреженной матрице и в пределах ограничений памяти?
см. Пакет 'glmnet' в' R' - он принимает разреженные матрицы, может быть более эффективным для вашей ситуации. –