У меня есть dataframe, который выглядит, как этотже наблюдение в нескольких столбцах
ID1 ID2 variables
a b something
b g something
c h something
d i something
a h something
Если идентификатор отображается в обоих ID1 и ID2 Я хочу наблюдение этого значения в ID1 должны быть исключены из набора данных. Так что в этом случае
ID1 ID2 variables
a b something
c h something
d i something
a h something
Что я считал:
Там может быть несколько наблюдений одного и того же ID. Переименование, конкатенация и удаление дубликатов не будут работать.
Набор данных довольно большой (миллионы наблюдений), поэтому петли для каждого значения не являются опцией.