У меня есть следующий набор данныхКак удалить дублированный сцепленную строку в R
path value
1 b,b,a,c 3
2 c,b 2
3 a 10
4 b,c,a,b 0
5 e,f 0
6 a,f 1
ф.р.
df <- data.frame (path= c("b,b,a,c", "c,b", "a", "b,c,a,b" ,"e,f" ,"a,f"), value = c(3,2,10,0,0,1))
, и я хочу, чтобы удалить дублируется в пути колонны. когда я использую этот код формат данных изменений:
df$path <- sapply(strsplit(as.character(df$path), split=","),
function(x) unique(x))
, и это дает мне данные, как dataframe
path value
1 c("b", "a", "c") 3
2 c("c", "b ") 2
...
Однако, я хотел бы иметь данные так:
path value
1 b, a, c 3
2 c, b 2
3 a 10
4 b, c, a 0
5 e, f 0
6 a, f 1
Вы действительно можете оставить его в качестве столбца списка, если вы используете 'lapply' вместо' sapply', который может быть более полезным в долгосрочной перспективе: 'ф.р. $ <путь - lapply (strsplit (as.character (df $ path), ','), уникальный) 'и, как представляется, печатается одинаково. – alistaire