У меня проблемы с sem_join от dplyr. В идеале я хотел бы сделать полу-соединение на dfA против dfB. dfA имеет повторяющиеся значения, а также dfB. Я хочу отменить все значения из dfA, которые имеют любые совпадения с dfB, даже дубликаты в dfA.sem_join in R, но дублировать дубликаты
dfA dfB >> dfC
x y z x g x y z
1 r 5 1 lkm 1 r 5
1 b 4 1 pok 1 b 4
2 4 e 2 jij 2 4 e
3 5 r 2 pop 3 5 r
3 9 g 3 hhg 3 9 g
4 3 0 5 trt
Что я хотел бы получить, это вывод dfC выше. Потому что, по крайней мере один матч х, он тянет назад все иксы в DFA
semi_join(dfA, dfB, by = "x")
dfC
x y z
1 r 5
2 4 e
3 5 r
inner_join(dfA, dfB, by = "x")
x y z g
1 r 5 lkm
1 r 5 pok
1 b 4 lkm
1 b 4 pok
2 4 e jij
2 4 e pop
3 5 r hhg
3 9 g hhg
Ни один из которых дал мне правильный результат. Любая помощь будет замечательной! Заранее спасибо
'DFA [dfA $ x% in% dfB $ x,] ' –