У меня есть набор данных, который состоит из идентификаторов образцов и соответствующей переменной результата. Однако в моем наборе данных есть несколько повторяющихся идентификаторов проб. То, что я хотел бы сделать, это идентифицировать дубликат идентификатора образца и перекодировать этот идентификатор образца как уникальное имя, а затем перекодировать переменную результата как отсутствующую. Я знаю, что было бы проще просто удалить всю строку, но мне нужно поддерживать количество строк.Дублировать идентификаторы/результаты повторного набора и перекодировать как уникальные и отсутствующие с помощью R
Так у меня есть набор данных, как это:
dt<- data.frame(ID=c("A", "B", "A", "C"), Outcome=c("1", "1", "1", "1"))
И я хотел бы перекодировать так это выглядит следующим образом:
dt1<- data.frame(ID=c("A", "B", "A.1", "C"), Outcome=c("1", "1", "-9", "1"))
Спасибо!
Что вы считали или пытались, и в чем проблема? – J0e3gan