У меня есть кадр даты с двумя столбцами. Я хотел бы удалить строки, где есть дубликаты записей в первом столбце. однако я хотел бы выбрать определенную строку, чтобы оставаться на основе значения вторых столбцов.Свернуть дублирующиеся строки по медианному значению в R
В частности - если есть 2 дубликатов записей в столбцах 1, Я хотел бы строку удалена с более низким значением в колонке 2
Или, если есть больше чем 2 одинаковые записи в столбцах 1, то я хотел бы, строка с медианным значением в строке 2 для сохранения.
Таким образом, для кадра данных
a <- c(rep("A", 3), rep("B", 3), rep("C",1), rep("D",1), rep("D",1))
b <- c(1,2,3,4,5,6,4,7,6)
df <-data.frame(a,b)
станет
a <- c(rep("A", 1), rep("B", 1), rep("C",1), rep("D",1))
b <- c(2,5,4,7)
df <-data.frame(a,b)
Я Пытался функции, специфический() и дублируется(), но не может найти аргументы, которые соответствуют этим критериям. Любая помощь очень ценится.
Для базы R вы также можете просмотреть '? Aggregate'. – SimonG