Следующий пример: - это (крайняя иллюстрация) моих данных.маркировка дубликатов в новой колонке в R
structure(list(X = structure(c(1L, 3L, 2L, 1L, 3L, 3L, 2L, 1L
), .Label = c("aaa", "bbb", "burp"), class = "factor")), .Names = "X", row.names = c(NA,
-8L), class = "data.frame")
dataExample
X
1 aaa
2 burp
3 bbb
4 aaa
5 burp
6 burp
7 bbb
8 aaa
EDIT: на основе содержимого одного столбца (например, «X»), я хотел бы создать новый столбец (например, «желательно»), который говорит мне, для каждого «кода символа» в столбец «X», независимо от того, смотрю ли я на первое, второе или на n-ое вхождение кода. Кроме того, существует один конкретный «код» из «X», который должен быть исключен из этого процесса подсчета и представлен в виде (например, «отрыжка»).
Здесь приведен пример ожидаемого результата
X desired
1 aaa 1
2 burp burp
3 bbb 1
4 aaa 2
5 burp burp
6 burp burp
7 bbb 2
8 aaa 3
NB: колонка «желаемый» представляет собой ожидаемый результат, он не является частью набора данных.
Это Это? Где остальная часть вопроса? –
Вы уверены, что хотите иметь смешанные классы в желаемом формате? I., какой класс должен быть числом? –
@RichardScriven Вот и все. В наборе данных реального мира у меня есть только тысячи строк и сотни данных. Кадры и 40 уникальных строк в нетривиальном формате, причем один из них остается нетронутым, как указано выше. – Pasqui