Я работаю над решением для очистки некоторых данных, но не на 100% уверен, что лучшее решение. Я нашел рабочее решение, но хотел бы знать, был ли более простой подход (особенно при попытке масштабировать его). То, что я хотел бы сделать, - это выделить все элементы в кадре данных (разделенные точкой с запятой), применить каждый из этих компонентов к элементу фрейма данных, а затем объединить результаты в новый фрейм данных. Пример ниже:Цитирование через кадр данных для создания нового фрейма данных
test <- data.frame(class=c("a1", "a2","a3","a4"),
person=c("p1;p3;p4","p2;p4","p4;p5;p6","p1;p5"),
stringsAsFactors = F)
test1 <- c()
test2 <- c()
for (i in 1:nrow(test)){
test1 <-append(test1, strsplit(test[i,2],";")[[1]])
test2 <- append(test2, rep(test[i,1],length(strsplit(test[i,2],";")[[1]])))
}