Есть ли способ использовать drop_duplicates
вместе с условиями? Например, давайте рассмотрим следующий Dataframe:Pandas: drop_duplicates с условием
import pandas as pd
df = pd.DataFrame({
'Customer_Name': ['Carl', 'Carl', 'Mark', 'Joe', 'Joe'],
'Customer_Id': [1000,None,None,None,50000]
})
Исходя из этого Dataframe я хотел бы вывести Dataframe с различными строками для Customer_Id
и Customer_Name
Customer_Id Customer_Name
0 1000 Carl
2 NaN Mark
5 50000 Joe
К сожалению, я не могу использовать метод drop_duplicates
для это, поскольку этот метод всегда удаляет первые или последние дублированные вхождения.
Однако в моем случае это отличается (см. Карл и Джо). Более того, я не могу просто удалить все строки с нитями в столбце Customer_Id, так как это также удалит запись для Mark.
Я глубоко признателен за любую помощь.
может быть, вы можете использовать что-то вроде 'df.groupby ('CUSTOMER_NAME'). Первый()'? –
Что произойдет, если у вас есть 2 не нулевые строки для одного клиента? –
Привет, Роман, тогда вы можете взять первый. Вы можете предположить, что имена одинаковы – Andy