У меня есть .xls
файл, который похож на это ...Python Панды read_csv правильно не импортируя
Value of Construction Put in Place...
(Millions of Dollars....)
Blank Row
Date Total_Construction Total Residential Total Nonresidential...Columns
Dec-15 1,116,570 435,454 681,217
Nov-15 1,115,966 432,295 683,671
Oct-15 1,122,749 431,164 691,585
.
.
.
Я пытаюсь импортировать файл, чтобы получить следующее:
Date Total_Construction Total Residential Total Nonresidential
Dec-15 1,116,570 435,454 681,217
Nov-15 1,115,966 432,295 683,671
Oct-15 1,122,749 431,164 691,585
.
.
.
С следующий код:
for chunk in pandas.read_csv('/PATH/totsatime.xls',
names = ['Date', 'Total Residential', 'Total Nonresidential'],
header = 4,
chunksize = 1,
skiprows = range(1, 4),
thousands = ','):
if chunk['Date'] == 'Dec-01':
break
else:
df = pandas.DataFrame(chunk)
Однако, я в конечном итоге следующее:
Date Total Residential Total Nonresidential
Lodging NaN NaN
Office NaN NaN
Commercial NaN NaN
Health care NaN NaN
Даты в конечном итоге отформатированы из столбцов, которые я не импортирую. Любые советы будут очень оценены.
Заранее спасибо.
Я думаю, вы должны попробовать 'read_excel': HTTP: //pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html – alpert
также забывать ломти и имена и т.д. ... Просто read_excel и он, вероятно, пойдет правильно. – dartdog