2014-01-19 6 views
37

У меня очень большой файл .csv, это около нескольких ГБ, я хочу прочитать первые несколько тысяч строк. есть ли способ сделать это?Как читать первые 1000 строк CSV-файла в R?

+0

http://stackoverflow.com/questions/3094866/trimming-a-huge-3-5-gb-csv-file-to-read-into-r?rq=1 –

+0

Я неоднократно приходил к этому вопросу, когда глядя, как решить ту же проблему. Я хотел бы видеть решения в readr read.csv и т. Д. И из числа обращений, фаворитов и фаворитов кажется, что было бы полезно снова открыть вопрос? – pluke

ответ

55

Используйте nrows аргумент в read.csv(...)

df <- read.csv(file="my.large.file.csv",nrows=2000) 

Существует также skip= параметр, который говорит read.csv(...), сколько строк пропустить, прежде чем начать читать.

Если ваш файл такой большой, вам может быть полезно использовать fread(...) в пакете data.table. Те же аргументы.

+0

'skip' не очень полезно, если первая строка - это строка имен столбцов. –

+1

@MatthewLundberg В этом случае вы можете 'scan()' первая строка с n = 1, а затем использовать 'read.csv' с' skip = 'и добавить после этого имена столбцов. –

13

Если вы на UNIX или OS/X, вы можете использовать командную строку:

head -n 1000 myfile.csv > myfile.head.csv 

Тогда просто прочитать его в R вроде нормально.

Смежные вопросы