может кто-нибудь помочь мне решить эту проблему с помощью R? Представьте, что каждый идентификатор считывает одно сообщение, которое будет записываться в данные. Являются следующие данные:Рассчитать среднее значение сообщений для новых пользователей в R?
> data
id date
1 1 2015-10-01
2 2 2015-10-01
3 2 2015-10-01
4 3 2015-10-01
5 4 2015-10-01
6 4 2015-10-01
7 5 2015-10-02
8 1 2015-10-02
9 3 2015-10-02
10 4 2015-10-02
11 6 2015-10-02
12 6 2015-10-02
13 7 2015-10-02
14 7 2015-10-02
15 1 2015-10-03
16 8 2015-10-03
17 8 2015-10-03
18 7 2015-10-03
19 3 2015-10-03
20 9 2015-10-03
21 9 2015-10-03
22 1 2015-10-04
23 2 2015-10-04
24 10 2015-10-04
25 11 2015-10-04
26 11 2015-10-04
Например: ID1 считывает одно сообщение в первый день, ID2 читает два сообщения на второй день, и так далее. Что мне нужно рассчитать - это среднее число сообщений для идентификаторов, которые являются новыми по сравнению с первым днем, такие как id5, id6 и id7 - это новые идентификаторы, начиная с 2015-10-2, общие новые сообщения для этих трех идентификаторов 5 сообщений, поэтому среднее число сообщений для новых пользователей составляет 5/3. Первый день 2015-10-1 средний - 6/4 (6 сообщений и 4 новых идентификатора). Надеюсь, что результат будет показан как один dataframe, который содержит переменную числа новых пользователей, а также количество сообщений для нового пользователя и среднее.
Согласно вашим данным, 'id 1' и' id 2' читают 1 и 2 сообщения в тот же день (2015-10-01), соответственно. И в вашем примере это 'uid', а не' id'. –