2013-05-04 4 views
0

У меня есть DataFrame как это:фильтра панда DataFrame столбцов

   A  B  C  D  
2000-01-03 -0.59885 0.18141 -0.68828 0.77572 
2000-01-04 0.83935 0.15993 0.95911 -1.12959 
2000-01-05 2.80215 -0.10858 -1.62114 -0.20170 
2000-01-06 0.71670 -0.26707 1.36029 1.74254 

Я хотел бы, чтобы фильтровать столбцы на основе значения первой строки. . Я хочу взять только те столбцы, где первое значение -> 0. и результат я ожидаю это:

   B  D  
2000-01-03 0.18141 0.77572 
2000-01-04 0.15993 -1.12959 
2000-01-05 -0.10858 -0.20170 
2000-01-06 -0.26707 1.74254 

Update Благодаря Джеффу предложению я написал этот код:

cols = [] 
firstRow = df.ix[0,:] 
for i in range(len(firstRow)): 
    if firstRow[i]>0: 
    cols.append(i) 
return df.ix[:, list(cols)].values.copy() 

Есть ли более элегантный способ сделать это?

ответ

1

Это, очевидно, использует данные, созданные ниже, но вы можете легко применить к вашему примеру. iloc[-2] выбирает 2-й к последней строке, и создает логический массив loc затем принимает, что логический массив и выберите соответствующие колонкам

In [2]: df = DataFrame(np.random.randn(4,4),columns=list('ABCD'), 
      index=date_range('20000103',periods=4)) 

In [3]: df 
Out[3]: 
        A   B   C   D 
2000-01-03 -0.132896 -0.151352 0.960943 -0.007701 
2000-01-04 -1.653279 -1.101331 -2.083493 -1.920517 
2000-01-05 -1.190868 0.983487 0.804209 0.962575 
2000-01-06 0.232290 2.152097 0.414457 1.023253 

In [6]: df.loc[:,df.iloc[-2]<0] 
Out[6]: 
        A 
2000-01-03 -0.132896 
2000-01-04 -1.653279 
2000-01-05 -1.190868 
2000-01-06 0.232290 
+0

AttributeError: объект «DataFrame» не имеет атрибута «iloc» – Roberto

+0

это кажется, что моя версия pandas не нравится iloc – Roberto

+0

, которая находится в 0.11. вы можете использовать ix вместо iloc/loc – Jeff

Смежные вопросы