У меня есть огромный разделенный запятыми файл (1,5 Gb) и хочу, чтобы прочитать одну конкретную строку из файла в R.Чтение определенной строки из огромного файла * быстро *
Я видел (много) версии этого вопроса во много раз, и все это говорит что-то вроде
con = file(fileName)
open(con)
scan(con, what=list("character", "character"), skip=1000000, nlines=1, sep="\t", quiet=TRUE)
это работает, но это по-прежнему крайне медленно - мы говорим от 20 до 30 секунд, чтобы прочитать одну строку!
Есть ли более быстрый способ? Разумеется, должен быть быстрый способ прыгнуть на определенную линию ...
Спасибо, миллион!
Для этого вы можете использовать 'data.table'! – Metrics
http://stackoverflow.com/questions/18235269/efficiently-reading-specific-lines-from-large-files-into-r – Peyton