Все -Python панда DataFrame из первой и последней строки CSV
Ищу создать панда DataFrame только из первых и последних строк очень большого CSV. Целью этого упражнения является возможность легко захватить некоторые атрибуты из первой и последней записей в этих файлах csv. У меня нет никаких проблем, захватывая первую строку CSV, используя: не
pd.read_csv(filename, nrows=1)
Я также не проблема захвата последней строки текстового файла различными способами, такими как:
with open(filename) as f:
last_line = f.readlines()[-1]
Однако, получение эти две вещи в один DataFrame меня бросили на цикл. Любое понимание того, как наилучшим образом достичь этой цели?
EDIT ПРИМЕЧАНИЕ. Я пытаюсь выполнить эту задачу, не загружая все данные в один DataFrame, поскольку я имею дело с довольно большими (> 15MM строками) csv-файлами.
Спасибо!
вы можете показать шаги, которые вы предприняли, пытаясь получить эти две вещи в одну DataFrame?и какая у вас ошибка – Anzel
@ Anzel первый фрагмент успешно захватывает первую строку и помещает ее в DataFrame. Второй фрагмент захватывает последнюю строку, но в нем отсутствуют заголовки, поэтому я не могу создать новый DataFrame и использовать простое объединение для объединения. – wrcobb