Соответствующие идентификаторы в двух наборах данных

У меня есть два набора данных, содержащих данные pre и post. Респонденты имеют уникальные идентификаторы, и я хочу создать подмножество, которое включает только тех, кто ответил на оба опроса. Пример набора данных:Соответствующие идентификаторы в двух наборах данных

pre.data <- data.frame(ID = c(1:10), Y = sample(c("yes", "no"), 10, replace = TRUE), 
    Survey = 1) 

post.data <- data.frame(ID = c(1:3,6:10), Y = sample(c("yes", "no"), 8, replace = TRUE), 
    Survey = 2) 

all.data <- rbind(pre.data, post.data)

У меня есть следующие функции:

match <- function(dat1, dat2, dat3){ #dat1 is whole dataset(both stitched together) 
    #dat2 is pre dataset #dat3 is post dataset 
    selectedRows <- (dat1$ID %in% dat2$ID & 
        dat1$ID %in% dat3$ID) 

    matchdata <- dat1[selectedRows,] 
    return(matchdata) 
} 

prepost.match.data <- match(all.data, pre.data, post.data)

Я думаю, что должно быть лучше, чем эта функция делает то же самое, но я не могу думать, как. Как я это сделал, кажется немного беспорядочным. Я имею в виду, он работает - он делает то, что я хочу, но я не могу не думать, что есть лучший способ.

Приносим извинения, если это уже было задано аналогичным образом, но я не смог его найти - в этом случае, пожалуйста, укажите мне соответствующий ответ.

источник

2013-04-18 Froom2

Что-то вроде: 'all.data [all.data $ ID в%% пересекаются (pre.data $ ID , post.data $ ID),] '? – Arun

Примечание: Arun отвечал тот же ответ на комментарий чуть раньше, чем у меня.

Вы можете использовать intersect так:

all.data[all.data$ID %in% intersect(pre.data$ID, post.data$ID),]

Что дает:

ID Y Survey 
1 1 yes  1 
2 2 no  1 
3 3 no  1 
6 6 yes  1 
7 7 yes  1 
8 8 yes  1 
9 9 no  1 
10 10 yes  1 
11 1 no  2 
12 2 yes  2 
13 3 no  2 
14 6 no  2 
15 7 yes  2 
16 8 yes  2 
17 9 no  2 
18 10 yes  2

источник

2013-04-18 14:12:10 juba

Это именно то, что мне нужно, спасибо! – Froom2

Посмотрите на участие в plyr.

prepost.match.data <- join(pre.data, post.data, by = c("ID"))

источник

2013-04-18 14:11:14 raynach

Это объединит данные по горизонтали, которые во многих приложениях будут более полезными. –

Хотя я положил другой ответ как принятый, это тоже хорошо работает - оставляя данные в широком формате, что действительно полезно во многих местах, но не для моих конкретных потребностей. Спасибо! – Froom2

Соответствующие идентификаторы в двух наборах данных

ответ

Смежные вопросы