У меня есть временный фреймворк pandas, который имеет дату, заданную как индекс, и количество столбцов (один - cusip).Groupby в pandas timeseries dataframe, выбирая последнее событие
Я хочу выполнить итерацию через dataframe и создать новый dataframe, где для каждого cusip я беру самые последние доступные данные.
Я пытался использовать GroupBy:
newData = []
for group in df.groupby(df['CUSIP']):
newData.append(group[group.index == max(group.index)])
'builtin_function_or_method' object is not iterable
In [374]: df.head()
Out[374]:
CUSIP COLA COLB COLC
date
1992-05-08 AAA 238 4256 3.523346
1992-07-13 AAA 234 4677 3.485577
1992-12-12 BBB 221 5150 3.24
1995-12-12 BBB 254 5150 3.25
1997-12-12 BBB 245 6150 3.25
1998-12-12 CCC 234 5140 3.24145
1999-12-12 CCC 223 5120 3.65145
Я хочу:
CUSIP COLA COLB COLC
date
1992-07-13 AAA 234 4677 3.485577
1997-12-12 BBB 245 6150 3.25
1999-12-12 CCC 223 5120 3.65145
Должен ли я подойти к этому еще один способ? Спасибо.
Pls разместить образец ваш набор данных и результат выборки – Jeff
добавлен - спасибо – user1911092