У меня есть кадр данных, где я хочу сравнить группу строк и удалить только в том случае, если вся группа одинакова. Например:Поиск уникальной группы строк в кадре данных
df<-data.frame(X=c("a", "a", "a", "b", "b", "b", "c", "c", "c"), Y=c(1,2,1,2,2,2,1,2,1), Z=c("ABC","DEF","ABC", "DEF", "DEF", "DEF", "ABC", "DEF", "ABC"))
X Y Z
1 a 1 ABC
2 a 2 DEF
3 a 1 ABC
4 b 2 DEF
5 b 2 DEF
6 b 2 DEF
7 c 1 ABC
8 c 2 DEF
9 c 1 ABC
Здесь группа идентифицируется столбцом X, и я хочу сравнить ее между различными группами. Итак, здесь группа a и группа c идентичны. Я хочу, чтобы получить конечный желаемый результат, как показано ниже:
GroupID Y Z
1 1 1 ABC
2 1 2 DEF
3 1 1 ABC
4 2 2 DEF
5 2 2 DEF
6 2 2 DEF
Любая идея, как я могу сделать этот вид сравнения?
Так, ДФ <- ДФ [! Дублируется (ДФ),]? –
@OliverKeyes Это приведет к удалению строки за строкой, и в этом случае он вернет 5 строк. В ожидаемом ответе выше есть 6 строк. –
Итак, вы ищете, для каждого уникального значения X, извлекаете отдельные (Y, Z) кортежи? –