Как сравнить значение первой строки в седловине b
и последней строки в седловине b
из группировки по седловине a
, без использования функции groupby
? Потому что функция groupby очень медленная для большого набора данных.панды dataframe сравнить первую и последнюю строку из каждой группы
a = [1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3]
b = [1,0,0,0,0,0,7,8,0,0,0,0,0,4,1,0,0,0,0,0,1]
Возврат два списка: один имеет названия групп из седловины a
где последнее значение больше, чем первое значение, и т.д.
larger_or_equal = [1,3]
smaller = [2]
Я знаю, что у меня есть ответ на это, если я просто понял вопрос. Можете ли вы сделать немного больше работы, объясняя, о чем вы говорите? – piRSquared
Вы пробовали 'groupby (sort = False)'? Это может ускорить работу с большим набором данных. – IanS
@piRSquared, группы '1' и' 3' выбраны, потому что последний элемент в группе больше или равен первому. – IanS