У меня был файл .rda с большим списком, который выглядел так:.rda файл, содержащий большой список увеличивается в размерах после удаления некоторых строк
[[1]] Null
[[2]] Null
...
[[1000]] (Some data)
...
Первые K
пустые строки (999 в данном примере) были созданы из-за ошибки в коде, поэтому я решил удалить все строки 1:K
. После сохранения файла он стал большим по размеру: до того, как он был < 1 ГБ и после него было> 16 ГБ. Как это могло быть? Как это исправить?
Я могу себе представить, что проблема заключается в том, что перед внесением изменений в списке он имел значение от 1 до N
, а после редактирования он содержит только значение от K+1
до N
, но она так отличается? Если это проблема, как очистить индексацию?
это интересно, но (маленький!) Воспроизводимый пример (с помощью 'сохранить() 'и' file.size() ') было бы очень полезно. –
Какой код вы использовали для удаления NULL. Это не обязательно «строки», если у вас не был фрейм данных. Пример того, как неудача строки индексируется 'replicate (5, NULL) [3,]' –