У меня есть DataFrame в sparkR под названием pgz
. Он содержит user_id
и time
. При фиксированном user_id k
я получаюКак проверить записи в DataFrame в sparkR
y <- filter(pgz, pgz$user_id == k)
Когда я типа head(y)
и я могу увидеть некоторые времена для user_id k
. «2005-02-04», «2005-06-06» .. Все они отсортированы, поэтому они увеличиваются. Для этого user_id
я хочу, чтобы проверить, если он имеет times
больше, чем установленное время я поставил на
fixtime <- "2010-01-01"
Я хотел бы сохранить все user_id, который анонсировал раз больше, чем fixtime. Как это можно сделать?