2013-08-19 2 views
0

У меня есть набор данных, есть повторяющиеся наблюдения, как сохранить уникальное наблюдение?Удалить дубликаты строк в R?

ID Date Type 
1 201301 A 
2 201308 B 
4 201303 R 
1 201301 A 
3 201305 C 
2 201308 B 

Что я хочу:

ID Date Type 
1 201301 A 
2 201308 B 
4 201303 R 
3 201305 C 

Я попробовал уникальную & дублированную функцию. Но это не сработало.

dataset[which(dataset$ID %in% unique(dataset$ID)),] # will keep all the row 

dataset[!duplicated(dataset$ID),] #will only keep the ID=3,4,as follows 
ID Date Type 
4 201303 R 
3 201305 C 

Как получить целевой набор данных в R?

+1

Когда я пытаюсь выполнить второй код ('dataset [! Duplicated (dataset $ ID),]') с вашим набором данных, он выводит ваш целевой набор данных, а не только набор данных с только ID 3 и 4 ... – plannapus

+0

Да, Ты прав! Он работал в данных примера! Тогда почему в моем реальном наборе данных функция «duplicated» удалит все записи, которые имеют две или несколько записей. Позвольте мне еще раз проверить, спасибо! Есть ли какая-либо другая функция, которая останется одной, а другая дублируемая будет удалена? – Sunny

+0

Я сожалею, я ошибся. Код (набор данных [! Duplicated (dataset $ ID),]) может выводить мой целевой набор данных! – Sunny

ответ

2

Либо

unique(dataset) 

или

dataset[!duplicated(dataset),] 

будет работать.

(Копирование ответа из комментариев в правильный ответ).