У меня есть набор данных, который выглядит следующим образом (в большинстве 5 колонка - но может быть меньше)Обработки переменного числа столбцов с пандами - Python
1,2,3
1,2,3,4
1,2,3,4,5
1,2
1,2,3,4
....
Я пытаюсь использовать панд read_table, чтобы прочитать это в 5-кадровый кадр данных. Я бы хотел прочитать это без дополнительного массажа.
Если я пытаюсь
import pandas as pd
my_cols=['A','B','C','D','E']
my_df=pd.read_table(path,sep=',',header=None,names=my_cols)
Я получаю сообщение об ошибке - "имена столбцов имеют 5 полей, данные 3 поля".
Есть ли способ сделать панды заполнять NaN для недостающих столбцов при чтении данных?
Спасибо! Это сработало - двигатель = 'python', кажется, ключевой. Добавление этого атрибута делает работу read_table и read_csv. –
Это кажется довольно бородавчатым для меня. Добавление проблемы github: https://github.com/pydata/pandas/issues/2981 –
Это работает корректно сейчас BTW без 'engine = 'python'' –