У меня есть огромный набор данных в виде файла txt со значениями, разделенными полуколонами и имеющими близкие к 2М строки. Мне нужны данные, соответствующие только определенным датам в первом столбце. Ввод пробы показано ниже:Фильтровать значения столбцов при чтении с использованием read.csv в R
Date;Time;Global_active_power;Global_reactive_power;Voltage;Global_intensity;Sub_metering_1;Sub_metering_2;Sub_metering_3
16/12/2006;17:24:00;4.216;0.418;234.840;18.400;0.000;1.000;17.000
16/12/2006;17:25:00;5.360;0.436;233.630;23.000;0.000;1.000;16.000
16/12/2006;17:26:00;5.374;0.498;233.290;23.000;0.000;2.000;17.000
Пожалуйста, помогите мне, чтобы отфильтровать данные, соответствующие двум датам сказать 1/2/2007 и 2/2/2007
Относительно легко отбрасывать столбцы в вызове 'read.csv' через аргумент col.classes. Если ваши данные упорядочены по дате, вы можете определить набор строк, которые вы хотите прочитать вручную, а затем использовать аргумент skip и nrows для чтения в этих строках. – lmo
Возможно, некоторые идеи здесь: http://stackoverflow.com/questions/6592219/read-csv-from-specific-row/6592373#6592373 – MrFlick
Кроме того, если этот набор данных приближается к потреблению вашей доступной памяти, вы должны принять посмотрите 'fread' в' data.table' или 'read.csv.raw' /' read.chunk' в 'iotools'. – lmo