Я написал функцию для удаления «дубликатов» из списка.Удалить дубликаты из списка списка на основе подмножества каждого списка
Элементы моего списка являются:
[ip, email, phone number].
Я хотел бы, чтобы удалить подсписки, которые получили тот же телефон и, я действительно не забочусь о IP-адресе.
Решение, которое я в настоящее время использую:
def remove_duplicate_email_phone(data):
for i in range(len(data)):
for j in reversed(range(i+1,len(data))):
if data[i][1] == data[j][1] and data[i][2] == data[j][2] :
data.pop(j)
return data
Я хотел бы оптимизировать это. Результат получился более 30 минут.
Использование 'pop' в списке должны действительно * никогда * быть сделано для произвольного позиции в петле. –