Привет, есть ли способ подсчитать количество запусков, отличное от HIVE?Улей: расчетный пробег DISTINCT
У меня есть кадр данных, который содержит дату и часы и идентификатор людей, которые в настоящее время посещают веб-сайт.
Что я хотел бы сделать, так это знать «кумулятивный» счет, отличный от деления на .
Я не могу использовать группу по дате, часу, счету (отдельный идентификатор), потому что если игрок активен в 1 и 2, он будет засчитан дважды.
Есть ли способ сделать это, используя аналитику улья и окна?
Я пробовал:
select date, hour,
count(distinct id) over(partition by date order by hrs rows between unbounded preceding and current row) users
from db.table
но выдает ошибку.
благодарит за ваш ответ! но я хотел бы сделать это с помощью функции окна .. и хотел бы знать, почему мой синтаксис неверен? – lucacerone
Я думаю, что это потому, что для оконных функций требуется агрегатная функция. Использование count (dinstinct (column)) over (...) обертывает функцию агрегации вокруг отдельного оператора. Разный оператор не является функцией aggegation, поэтому неопределенный (столбец) над (...) терпит неудачу. Удачи lucacerone! :) – invoketheshell