У меня есть набор данных следующим образом:Как подмножество группы с dplyr
col1 col2
1 26
1 43
1 34
2 54
2 27
3 15
4 1
4 4
Я хотел бы, чтобы выбрать только те группы, в которых col2 составляет более 25, так что в результате набор данные должны быть
col1 col2
1 26
1 43
1 34
2 54
2 27
Это пример набор данные, а не реальная вещь так, а не простое подмножество ответа я действительно ищу dplyr ответ по линиям:
Nr<-Mrd %>%
group_by(col1) %>%
slice(which.min(col2>25))
однако этот ответ даст мне строки в каждой группе, которые составляют> 25, а не группы, которые имеют> 25 как минимум.
Я не понимаю ваш желаемый выход. Ни в одной из ваших групп минимальное значение больше 25. Вы ищете * любое * значение больше 25? Что-то вроде 'Mrd%>% group_by (col1)%>% filter (any (col2> 25))'? Вам действительно нужно попытаться правильно объяснить себя. –
Вы хотите сказать, что вы хотите сохранить 'col1', где есть хотя бы 1 значение> 25 в' col2'? (т. е. в базе r 'ind <- df $ col1 [df $ col2> 25]; df [df $ col1% in% ind,]' – Sotos
Извинения. Я изменил данные, чтобы минимум в первых двух группах составляет более 25. Вопрос остается тем же, но я хочу получить группы, где минимум больше 25 –