2016-04-27 3 views
0

У меня есть .xls файл, который похож на это ...Python Панды read_csv правильно не импортируя

Value of Construction Put in Place... 
(Millions of Dollars....) 
Blank Row 
Date Total_Construction Total Residential Total Nonresidential...Columns 
Dec-15 1,116,570   435,454   681,217 
Nov-15 1,115,966   432,295   683,671 
Oct-15 1,122,749   431,164   691,585 
. 
. 
. 

Я пытаюсь импортировать файл, чтобы получить следующее:

Date Total_Construction Total Residential Total Nonresidential 
Dec-15 1,116,570   435,454   681,217 
Nov-15 1,115,966   432,295   683,671 
Oct-15 1,122,749   431,164   691,585 
. 
. 
. 

С следующий код:

for chunk in pandas.read_csv('/PATH/totsatime.xls', 
       names  = ['Date', 'Total Residential', 'Total Nonresidential'], 
       header  = 4, 
       chunksize = 1, 
       skiprows = range(1, 4), 
       thousands = ','): 

    if chunk['Date'] == 'Dec-01': 
     break 

    else: 
     df = pandas.DataFrame(chunk) 

Однако, я в конечном итоге следующее:

Date    Total Residential  Total Nonresidential 
Lodging   NaN     NaN 
Office   NaN     NaN 
Commercial  NaN     NaN 
Health care  NaN     NaN 

Даты в конечном итоге отформатированы из столбцов, которые я не импортирую. Любые советы будут очень оценены.

Заранее спасибо.

+0

Я думаю, вы должны попробовать 'read_excel': HTTP: //pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html – alpert

+0

также забывать ломти и имена и т.д. ... Просто read_excel и он, вероятно, пойдет правильно. – dartdog

ответ

Смежные вопросы