В настоящее время я запускаю скрипт, который читает около 8500 файлов csv (8.3mb каждый) и добавляет столбец из csv, если выполняются определенные условия. Файлы csv содержат только числа, за исключением заголовков и пробелов.Чтение и запись больших csv matlab vs. r
My R script использует fread, а затем преобразует таблицы данных в матрицы, прежде чем использовать write.table для повышения скорости. Запуск скрипта для 2160 файлов (около 17 ГБ) привел к 3,8 ГБ csv-файлу и занял около 3,2 часа. Fread для каждого файла занимает от 3-4 секунд.
Я рассматриваю возможность написания сценария matlab, поскольку я заметил, что Matlab также имеет формат fread и сохраняет формат мата, что позволяет сэкономить время. Может ли использование matlab значительно сократить время чтения и записи на csv?
Попробуйте на подмножества данных и видеть, что все из нас будет делать. – excaza
Проверьте свой баран, а затем попробуйте несколько раз в r – Pau