Я имею дело с набором данных с данными на уровне дня (одна строка на один день) - с данными для продукта (который рекламируется) о том, он просматривается пользователем или если предпринимается действие.Повысить эффективность оператора Sqldf в R альтернативными способами
Перед тем, как запустить мой анализ на этом наборе данных в R - я хочу отфильтровать данные таким образом, что я отфильтровываю все дни, когда разность количества просмотров продукта и количество раз, когда действие принимаются в 2 и взглядах 3. я был в состоянии сделать это с помощью оператора SQL в R - Сначала я отфильтровать необходимые дни с помощью пакета sqldf как:
filterd_days = sqldf(select day, count(views) as seen, count(action)
as actions from subset_data group by day
having (count(views) - count(action) = 2) and count(views) = 3)
затем я присоединиться к этому набору данных (о/p SQL) с исходным, чтобы отфильтровать исходный набор данных с требуемыми датами.
data_new = data[data$day %in% filter_days$day,]
Но это принимает близко к 5 минут для каждого набора данных для выполнения и, как это должно работать каждый день, интересно, если есть более быстрый способ, чтобы выполнить эту операцию и получить тот же O/P.
Предоставление образцов входных данных и ожидаемых выходных данных будет наиболее полезно при получении рабочего ответа. – Gopala
Попробуйте добавить указатель. Для примера см. Страницу sqldf github. –