Приложение My R считывает входные данные из больших файлов txt. он не читает весь файл за один выстрел. Пользователи определяют имя гена (3 или 4 за раз) и на основании ввода пользователя приложение переходит в соответствующую строку и считывает данные.Оптимизация чтения файлов в R
Формат файла: 32 000 строк (один ген в строке, первые два столбца содержат информацию о имени гена и т. Д.) 35 000 столбцов с числовыми данными (десятичные числа).
Я использовал read.table (имя файла, skip = 10 000) и т. Д., Чтобы перейти в правую строку, затем читать 35 000 столбцов данных. то я делаю это снова для второго гена, третьего гена (максимум до 4 генов) , а затем обрабатывает численные результаты.
Операции чтения файлов занимают около 1,5-2,0 минут. Я экспериментирую с , читая весь файл, а затем беру данные для желаемых генов.
Любой способ ускорить это? Я могу переписать данные гена в другом формате (одна обработка ), если это ускорит операции чтения в будущем.
Попробуйте 'fread' из пакета данных.table. – Roland
http://stackoverflow.com/questions/1727772/quickly-reading-very-large-tables-as-dataframes-in-r/15058684#15058684 – eddi