2013-11-01 5 views
31

Я хочу сделать все заголовки столбцов в моем панд кадра данных строчногопитон: сделать панда dataframe заголовков столбцов в нижнем регистре

, например, если у меня есть:

data = 

    country country isocode year  XRAT   tcgdp 
0 Canada    CAN 2001 1.54876 924909.44207 
1 Canada    CAN 2002 1.56932 957299.91586 
2 Canada    CAN 2003 1.40105 1016902.00180 
.... 

Я хотел бы изменить XRAT чтобы xrat делать что-то вроде:

data.headers.lowercase() 

Так что я получаю:

country country isocode year  xrat   tcgdp 
0 Canada    CAN 2001 1.54876 924909.44207 
1 Canada    CAN 2002 1.56932 957299.91586 
2 Canada    CAN 2003 1.40105 1016902.00180 
3 Canada    CAN 2004 1.30102 1096000.35500 
.... 

Я не буду знать имена каждого заголовка столбца раньше времени.

Спасибо!

ответ

60

Вы можете сделать это следующим образом:

data.columns = map(str.lower, data.columns) 

или

data.columns = [x.lower() for x in data.columns] 

пример:

>>> data = pd.DataFrame({'A':range(3), 'B':range(3,0,-1), 'C':list('abc')}) 
>>> data 
    A B C 
0 0 3 a 
1 1 2 b 
2 2 1 c 
>>> data.columns = map(str.lower, data.columns) 
>>> data 
    a b c 
0 0 3 a 
1 1 2 b 
2 2 1 c 
+3

Обратите внимание, что это может привести к дублированию имен столбцов при более низком (column1) == lower (column2) (например, «a» и «A»). Это может иметь непреднамеренные последствия при обращении к столбцам позже. (например, данные ['a'] возвращают DataFrame, а не Series, со всеми столбцами с именем «a»). См. Этот пример для примера: https://gist.github.com/grisaitis/170e82a008480acb4fa3 – grisaitis

+0

'[x.lower() для x в data.columns]' равнозначно: '[x.lower() для x в данных] ' – joctee

9

Если вы хотите сделать переименование с использованием прикован вызова метода, вы можете использование

data.rename(
    columns=unicode.lower 
) 

(Python 2)

или

data.rename(
    columns=str.lower 
) 

(Python 3)

27

Вы можете сделать это легко с str.lower для columns:

df.columns = df.columns.str.lower() 

Пример:

In [63]: df 
Out[63]: 
    country country isocode year  XRAT   tcgdp 
0 Canada    CAN 2001 1.54876 9.249094e+05 
1 Canada    CAN 2002 1.56932 9.572999e+05 
2 Canada    CAN 2003 1.40105 1.016902e+06 

In [64]: df.columns = df.columns.str.lower() 

In [65]: df 
Out[65]: 
    country country isocode year  xrat   tcgdp 
0 Canada    CAN 2001 1.54876 9.249094e+05 
1 Canada    CAN 2002 1.56932 9.572999e+05 
2 Canada    CAN 2003 1.40105 1.016902e+06 
Смежные вопросы