Я отсортированных в соответствии с dataframe второго и третьего столбца, используя следующий код:Выберите представительные элементы из dataframe
EXP[rev(order(EXP$1, EXP$2)),]
, где EXP это имя фрейма данных.
Теперь мне нужна только первая строка каждого репрезентативного идентификатора, отсортированного по второму столбцу. Каков наилучший способ сделать это в R?
Структура данных выглядит следующим образом:
A_1784709 10007 0.40446362
B_2329958 10006 0.22501015
A_1739081 10006 0.10621801
B_1679600 10005 0.51709792
A_1770963 10004 0.21095531
A_2067520 100033416 0.08301735
A_1740024 10003 0.40881969
B_1751882 10002 0.09964711
A_1667906 10002 0.08826233
B_1791916 10002 0.08408508
A_1775734 10044 0.28613624
B_1674440 10044 0.16204336
B_2321648 10044 0.15484888
B_1654543 10001 0.27293547
B_1733559 100008589 1.03071504
A_2325610 10000 0.29913509
A_1733598 10000 0.14406499
B_1757130 10000 0.12600686
A_1779228 1000 0.37764131
A_1803686 100 0.62712817
A_1670903 10 0.09947230
И мне нужны результаты что-то вроде этого:
A_1784709 10007 0.40446362
B_2329958 10006 0.22501015
B_1679600 10005 0.51709792
A_1770963 10004 0.21095531
A_2067520 100033416 0.08301735
A_1740024 10003 0.40881969
B_1751882 10002 0.09964711
A_1775734 10044 0.28613624
B_1654543 10001 0.27293547
B_1733559 100008589 1.03071504
A_2325610 10000 0.29913509
A_1779228 1000 0.37764131
A_1803686 100 0.62712817
A_1670903 10 0.09947230
Или 'library (data.table); unique (setDT (df1), by = 'V2')'. – akrun
Приятно видеть, что вы использовали 'duplicated'. Я пытался с помощью 'slice' в dplyr, но все равно не мог получить результаты в правильном порядке. – akrun
Используя dplyr, это будет' different (EXP, V2) ' –