У меня есть большое количество файлов Excel, которые мне нужно загрузить из Интернета, а затем извлекать из заголовка (столбцов) только из заголовка и затем переходить. Пока мне удалось загрузить весь файл, а затем прочитать его в Pandas DF, из которого я могу извлечь имена столбцов.Читайте только заголовки файлов Excel
Есть ли более быстрый способ читать, а не загружать или анализировать только заголовок, а не весь файл Excel?
resp = requests.get(test_url)
with open('test.xls', 'wb') as output:
output.write(resp.content)
headers = pd.ExcelFile("test.xls").parse(sheetname = 2)
headers.columns
Если не является эффективным способом «частично» загрузить файл Excel, чтобы получить только заголовок, есть эффективный способ читать только заголовок после того, как она уже была загружена?
Я получаю то, что вы говорите о частичной загрузке файла excel, но как, после того, как весь файл был загружен, есть ли способ прочитать только строку заголовка файла, а не все это? – Josh
@Josh: чтение локального файла обычно менее тяжелое, чем загрузка, поэтому вам не стоит об этом беспокоиться. Но оставшаяся часть моего сообщения по-прежнему действительна: либо вы полагаетесь на библиотеку высокого уровня, и ее задача - узнать, какую часть файла читать, или вы делаете это вручную, анализируя двоичные дампы, чтобы выполнить тяжелую работу самостоятельно. Мой совет ** НЕ НЕТ! **, возможное усиление после загрузки файла не стоит. –
Как насчет конвертации в csv сначала через pandoc или что-то еще? – JasonAizkalns