2013-12-10 2 views
143

У меня есть кадр данных, из которого я удаляю несколько строк. В результате я получаю фрейм данных, в котором индекс выглядит примерно так: [1,5,6,10,11], и я хотел бы сбросить его до [0,1,2,3,4]. Как мне это сделать?Как сбросить индекс в кадре данных pandas?

ДОБАВЛЕНО

Следующая, кажется, работает:

df = df.reset_index() 
del df['index'] 

Следующая не работает:

df = df.reindex() 

ответ

318

reset_index() является то, что вы ищете. Если вы не хотите его сохранить в виде колонки, а затем сделать:

df = df.reset_index(drop=True) 
+47

+1 для 'drop = True' – Rhubarb

+53

Вместо того, чтобы переназначить dataframe на ту же переменную, вы можете установить аргумент' inplace = True'. – ahuelamo

+1

Обратите внимание, что в случае 'inplace = True' метод возвращает None – alyaxey

8

Другие решения правопреемником RangeIndex или range:

df.index = pd.RangeIndex(len(df.index)) 

df.index = range(len(df.index)) 

Это быстрее:

df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8]) 
df = pd.concat([df]*10000) 
print (df.head()) 

In [298]: %timeit df1 = df.reset_index(drop=True) 
The slowest run took 7.26 times longer than the fastest. This could mean that an intermediate result is being cached. 
10000 loops, best of 3: 105 µs per loop 

In [299]: %timeit df.index = pd.RangeIndex(len(df.index)) 
The slowest run took 15.05 times longer than the fastest. This could mean that an intermediate result is being cached. 
100000 loops, best of 3: 7.84 µs per loop 

In [300]: %timeit df.index = range(len(df.index)) 
The slowest run took 7.10 times longer than the fastest. This could mean that an intermediate result is being cached. 
100000 loops, best of 3: 14.2 µs per loop 
+0

@Outcast Source - самым быстрым является' len (df.index) ', 381ns vs' df.shape' 1.17us. Ойр чего-то не хватает? – jezrael

Смежные вопросы