У меня возникают проблемы при попытке рассчитать средний временной интервал (сколько дней) между появлениями одного и того же значения в другом столбце.Как рассчитать средний временной интервал на основе уникального значения?
Мои данные выглядит следующим образом:
dt subject_id
2016-09-13 77
2016-11-07 1791
2016-09-18 1332
2016-08-31 84
2016-08-23 89
2016-08-23 41
2016-09-15 41
2016-10-12 93
2016-10-05 93
2016-11-09 94
2016-10-25 94
2016-11-03 94
2016-10-09 375
2016-10-14 11
2016-09-27 11
2016-09-13 11
2016-08-23 11
2016-08-27 11
И я хочу, чтобы получить что-то вроде этого:
subject_id mean_day
41 23
93 7
94 7.5
11 13
Я пытался использовать:
aggregate(dt~subject_id, data, mean)
Но он не может вычислять среднее из значений даты. Есть идеи?
Как рассчитывается среднее значение? 23 и 7 не выглядит как среднее. Это просто различия между двумя датами. –