У меня есть две большие таблицы с несколькими полями (но с разными именами полей). Каким будет самый простой/быстрый способ найти (и удалить) такие общие записи?найти (и удалить) общие записи между двумя таблицами (data.table)
К примеру, у меня есть
set.seed(2)
dt1 <- data.table(dt1field1=1:9, dt1field2=LETTERS[runif(9,1,5)], dt1field3=letters[runif(9,12,15)])
dt2 <- data.table(dt2field1=1:10, dt2fieldB=LETTERS[runif(10,1,5)], dt2fieldC=letters[runif(10,12,15)])
(извините за тупое наполнение)
Что бы data.table
синтаксиса, чтобы найти все записи, в которых t1field2=t2fieldB
И t1field3=t2fieldC
? (ОК, если это необходимо, я могу сначала переименовать поля, чтобы иметь равные имена для сравниваемых полей)
Большое спасибо!
благодарит за ответ! Я немного изменил пример, и теперь кажется, что ваш первый код дает не только уникальные значения, но и все записи из dt1 PLUS те записи из dt2, которые имеют одинаковые значения ... –
Это хороший момент - я не понял что. Вы можете придерживаться второй части ответа, или добавить '[! Is.na (dtfield1)]' до конца. –