2014-11-25 3 views
14

У меня проблема с добавлением столбцов в пандах. У меня DataFrame, размер nxk. И в процессе мне нужно добавить столбцы с размером mx1, где m = [1, n], но я не знаю m.добавить столбцы разную длину pandas

Когда я пытаюсь сделать это:

df['Name column'] = data  
# type(data) = list 

результат:

AssertionError: Length of values does not match length of index 

Могу ли я добавить столбцы с различной длиной?

ответ

16

Использование CONCAT и передать axis=1 и ignore_index=True:

In [38]: 

import numpy as np 
df = pd.DataFrame({'a':np.arange(5)}) 
df1 = pd.DataFrame({'b':np.arange(4)}) 
print(df1) 
df 
    b 
0 0 
1 1 
2 2 
3 3 
Out[38]: 
    a 
0 0 
1 1 
2 2 
3 3 
4 4 
In [39]: 

pd.concat([df,df1], ignore_index=True, axis=1) 
Out[39]: 
    0 1 
0 0 0 
1 1 1 
2 2 2 
3 3 3 
4 4 NaN 
+0

@ TheRedPea Я перевернул вашу редакцию назад, ваше предложение должно было быть комментарием, а не редактированием моего ответа, поскольку изменения должны быть использованы для улучшения или исправления ответа, а не для альтернативных ответов. – EdChum

+0

Я думал об этом как о улучшение. Если вы считаете, что это альтернатива, я отправлю отдельный ответ. –

22

Если вы используете общепринятый ответ, вы потеряете ваши имена столбцов, как показаны в принятом ответе примера и описано в documentation (курсив добавлено):

в результате ось будет помечена 0, ..., п - 1. Это полезно, если вы конкатенация объекты, где ось конкатенации делает не ВГА значимая информация индексации.

Похоже, что названия ваших колонок ('Name column') имеют смысл.

Вы можете использовать pandas.concat, но неignore_index (значение по умолчанию ignore_indexfalse, так что вы можете пропустить этот аргумент в целом):

import pandas 

# Note these columns have 3 rows of values: 
original = pandas.DataFrame({ 
    'Age':[10, 12, 13], 
    'Gender':['M','F','F']}) 

# Note this column has 4 rows of values: 
additional = pandas.DataFrame({ 
    'Name': ['Nate A', 'Jessie A', 'Daniel H', 'John D'] 
}) 

new = pandas.concat([original, additional], axis=1) 
# Identical: 
# new = pandas.concat([original, additional], ignore_index=False, axis=1) 

print(new.head()) 

#   Age  Gender  Name 
#0   10    M  Nate A 
#1   12    F Jessie A 
#2   13    F Daniel H 
#3   NaN   NaN  John D 

Обратите внимание, как Джон D не имеют возраст или Пол.

Смежные вопросы