Предположим, что у меня есть dataframe:добывающие переменные в R с использованием частот
x y
a 1
b 2
a 3
a 4
b 5
c 6
a 7
d 8
a 9
b 10
e 12
b 13
c 15
Я хочу, чтобы создать другой dataframe который включает в себя только x
значения, которые возникают, по крайней мере в 3 раза (a
и b
, в данном случае), и их наивысшие соответствующие значения y
.
Так что я хочу, выход как:
x y
a 9
b 13
Здесь 9
и 13
являются высокие значения a
и b
соответственно
Я попытался с помощью:
sort-(table(x,y))
, но это не так Работа.
'aggregate (y ~ x, data = with (dat, dat [ave (y, x, FUN = length)> = 3,]), FUN = max)' в качестве альтернативы, используя аналогичную логику. – thelatemail
@thelatemail - приятно, что кажется более приятным для глаз. – jbaums
Спасибо @jbaums :) – Learner27