У меня есть pandas
dataframe с несколькими строками, которые находятся рядом с дубликатами друг друга, за исключением одного значения. Моя цель - объединить или «объединить» эти строки в одну строку, не суммируя числовые значения.pandas - Объединить почти повторяющиеся строки на основе значения столбца
Вот пример того, что я работаю с:
Name Sid Use_Case Revenue
A xx01 Voice $10.00
A xx01 SMS $10.00
B xx02 Voice $5.00
C xx03 Voice $15.00
C xx03 SMS $15.00
C xx03 Video $15.00
А вот то, что я хотел бы:
Name Sid Use_Case Revenue
A xx01 Voice, SMS $10.00
B xx02 Voice $5.00
C xx03 Voice, SMS, Video $15.00
причина, почему я не хочу, чтобы подвести «Прибыльность столбец потому, что моя таблица является результатом поворота в течение нескольких периодов времени, когда «Доход» просто заканчивается тем, что перечисляется несколько раз вместо того, чтобы иметь другое значение для «Use_Case».
Что было бы лучшим способом решить эту проблему? Я просмотрел функцию groupby()
, но я до сих пор не очень хорошо ее понимаю.
Если мой ответ или ответ Ами был полезен, не забудьте [принять] (http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work) его. Благодарю. – jezrael
Спасибо! Они оба работают хорошо. Мне может потребоваться объединить несколько столбцов, так как мой фактический набор данных намного шире, чем я предоставил 4, но это должно сделать трюк. –