У меня есть 2 таблицы, «сделки» с более чем 500M строк и «Клиенты» над 3M рядамиUpdate dataframe из другого dataframe
data <- data.frame(Trans = c(1,2,3,4,5), Cust01 = c("A","B","C","D","F"),
Cust02 = c("S","E","","TE","F"), Cust03 = c("F","","D","","F"))
cust_type <-data.frame(Cust = c("A","B","C","D"), Type = c("1","2","3","4"))
dataresult <- data.frame(Trans = c(1,2,3,4,5),
Cust01 = c("A","B","C","D","F"),
Cust01Type = c("1","2","3","4","5"),
Cust02 = c("S","E","","TE","F"),
Cust02Type = c("","","","",""),
Cust03 = c("F","","D","","F"),
Cust03Type = c("","","4","",""))
Я хотел бы добавить тип клиента к данным эффективным способом. Обычно с sql
Я буду использовать несколько левых соединений, я пробовал это с dplyr
, но навсегда. Я также попытался использовать %in%
с логическим возвратом, а затем цикл, чтобы сосредоточиться на истинных значениях. Знает ли кто-нибудь лучший способ сделать это?