Так я это DataFrame с 3 колонками «Order ID 'Количество заказа' и 'Fill Кол-во'Python Панды GroupBy(). Sum() Наличие пункта
Я хочу суммировать Заливка Кол-во в порядке затем сравнить это для Order Qty. В идеале я верну только блок данных, который дает мне идентификатор заказа, когда агрегированный Fill Qty больше, чем Order Qty.
В SQL Я думаю, что я ищу это
SELECT * FROM DataFrame GROUP BY Order ID, Order Qty HAVING sum(Fill Qty)>Order Qty
До сих пор у меня есть это:
SumFills= DataFrame.groupby(['Order ID','Order Qty']).sum()
выход:
....................................Fill Qty
Order ID - Order Qty -
1--------- 300 --------- 300
2 --------- 80 ----------- 40
3 --------- 20 ----------- 20
4 --------- 110 ---------- 220
5 --------- 100 ---------- 200
6 --------- 100 ---------- 200
Выше агрегатируется уже, я бы в идеале хотел бы вернуть список/массив [4,5,6], поскольку те имеют sum(fill qty) > Order Qty
Имеются ли в ваших данных несколько строк, где идентификатор заказа совпадает? Если да, то порядок QTY остается статическим для всех этих строк? – kennes
Каждый заказ будет иметь одну запись, так что да, каждый идентификатор заказа имеет ровно один связанный с ним номер заказа – Adam