Я пытаюсь использовать Pandas pivot_table для перемещения позиций в своих квитанциях в виде столбцов, оставляя только одну строку за квитанцию. Моя главная задача - назвать мои новые столбцы, подсчитывая числа по мере необходимости и заполнить NaNs.Pandas Pivot table - инкрементные имена столбцов
Я пытаюсь сделать это:
customer_id receipt_id item_id
01 100 420
05 400 450
05 400 460
05 400 320
05 400 270
02 300 320
02 300 460
05 200 220
... выглядеть следующим образом:
customer_id receipt_id 1 2 3 4 n..
01 100 420 NaN NaN NaN
05 400 450 460 320 270
02 300 320 460 NaN NaN
05 200 220 NaN NaN Nan
Я пытался заставить его работать, но я не близко.
pt = pd.pivot_table(df, values=["item_id"], index=["customer_id", "receipt_id"], columns=["item_id"], fill_value="NaN").reset_index()
Спасибо, Изераэль! Ваше решение отлично работает. На 33-миллиметровых рядах, в среднем по 2 штуки за квитанцию, он работал 20 минут, используя оперативную память 58 ГБ. В некоторых квитанциях было до 30 наименований. Я сбросил все числовые столбцы> 8. – user6453877
Рад может вам помочь! Приятный день! – jezrael