У меня есть файл CSV с несколькими столбцами, каждый из которых содержит адреса электронной почты. Я хочу удалить любые дубликаты во всем файле.Удаление дубликатов по нескольким столбцам в R
- У кого-нибудь есть ответ для этого, используя R?
У меня есть файл CSV с несколькими столбцами, каждый из которых содержит адреса электронной почты. Я хочу удалить любые дубликаты во всем файле.Удаление дубликатов по нескольким столбцам в R
df <- data.frame(email1 = c('[email protected]', '[email protected]'),
email2 = c('[email protected]', '[email protected]'),
stringsAsFactors = FALSE)
all_unique_emails <- unique(c(df$email1, df$email2))
Сортировка зависит от того, что вы хотите, в конце концов, вы хотите, точно так же CSV файл НСБУ вместо дублированных писем? Или вам просто нужен список/вектор уникальных писем?
Ознакомьтесь с функциями unique() и duplicated(), они должны иметь возможность, по крайней мере, определить, существует ли почта.
Лучше всего найти информацию в другом месте, а когда она не работает или вы не можете заставить ее работать, вернитесь с ошибками. Вы будете изо всех сил пытаться заставить людей помочь вам с вышеуказанной информацией –