У меня есть данные, которые имеют желаемый диапазон, но попадают в области, которые считаются слишком высокими или слишком низкими. Я хотел бы иметь возможность группировать экземпляры слишком высоких или слишком низких значений в виде отдельных экземпляров. Я сделал некоторые поддельные данные здесь:данные временных рядов группировки по пороговому значению
library(dplyr)
library(ggplot2)
set.seed(123432)
dat <- data.frame(value = sample(20:600, 20, replace=F))%>%
mutate(ord = row_number(),
cat = ifelse(value > 350, "high",
ifelse(value < 90, "low", "good")),
extreme = ifelse(cat=="high" & value > lag(value) & value > lead(value), "Peak",
ifelse(cat=="low" & value < lag(value) & value < lead(value), "Trough", "")))
и график его здесь:
ggplot(dat, aes(x = ord, y = value))+
geom_point()+
geom_line()+
geom_hline(yintercept = 300, color="blue")+
geom_hline(yintercept = 120, color="blue")+
coord_fixed(.025)
Я знаю, как группа в первенствует эти высокие & низкие области, но может» t, похоже, повторяет его в R. Я хотел бы произвести что-то вроде этого (хотя E1 будет «Series»):
Столбец уведомления E на основе столбца C & может иметь более одного пика/желоба для каждой серии.
Надеюсь, это было ясно, и вы, люди, можете помочь. Если возможно, я хотел бы придерживаться dplyr.
спасибо.
Это не для меня ясно, что вы на самом деле хотите. Участок? Отдельный кадр данных? Отдельные столбцы фрейма данных? Определите для нас «отдельный экземпляр». –
Я хочу, чтобы столбец был добавлен в мой фрейм данных, который выглядит как столбец E в примере excel. Он должен увеличиваться в стоимости каждый раз, когда происходит изменение в переменной «cat». – yake84