2014-01-26 2 views
0

Я использую повторяющиеся результаты для оценки неопределенности измерений для химических анализов. Когда я извлекаю данные из базы данных лаборатории, она состоит в основном из отдельных результатов, но с некоторыми образцами, которые тестировались дважды, несколько более чем в два раза (я видел до 12). Я хочу отказаться от всех отдельных анализов и просто сохранить дублированные результаты, но включая исходный результат.Извлеките оригинальные и повторяющиеся результаты из кадра данных в R

Образцы идентифицируются номером выборки, который является общим для дублирующих выборок.

Я могу вытащить дубликаты с помощью duplicated(), но как сохранить первый результат?

Спасибо.

ответ

2
> dat <- data.frame(
    id = sample(1:5, 10, replace = TRUE), 
    x = rnorm(10) 
    ) 

> dat 
## id   x 
## 1 1 0.7060512 
## 2 4 0.6804117 
## 3 2 0.2395902 
## 4 2 1.5352574 
## 5 1 0.2376593 
## 6 4 0.8019506 
## 7 1 -1.0506505 
## 8 5 1.0554555 
## 9 3 0.3637685 
## 10 5 -0.8404215 
> dat[duplicated(dat$id) | duplicated(dat$id, fromLast = TRUE),] 
## id   x 
## 1 1 0.7060512 
## 2 4 0.6804117 
## 3 2 0.2395902 
## 4 2 1.5352574 
## 5 1 0.2376593 
## 6 4 0.8019506 
## 7 1 -1.0506505 
## 8 5 1.0554555 
## 10 5 -0.8404215 
+0

Отлично. Спасибо. –

Смежные вопросы