Я использую Rstudio (версия .99.903), имею компьютер (Windows 8). У меня есть следующий вопрос со вчерашнего дня, поскольку проблема усложнилась. Вот как выглядят данные, как:Сравнение последних усредненных значений с текущим значением в R
Number Trial ID Open date Enrollment rate
420 NCT00091442 9 1/28/2005 0.2
1476 NCT00301457 26 2/22/2008 1
10559 NCT01307397 34 7/28/2011 0.6
6794 NCT00948675 53 5/12/2010 0
6451 NCT00917384 53 8/17/2010 0.3
8754 NCT01168973 53 1/19/2011 0.2
8578 NCT01140347 53 12/30/2011 2.4
11655 NCT01358877 53 4/2/2012 0.3
428 NCT00091442 55 9/7/2005 0.1
112 NCT00065325 62 10/15/2003 0.2
477 NCT00091442 62 11/11/2005 0.1
16277 NCT01843374 62 12/16/2013 0.2
17386 NCT01905657 62 1/8/2014 0.6
411 NCT00091442 66 1/12/2005 0
Что мне нужно сделать, это сравнить показатель охвата самых текущей даты в заданном ID в среднее тех значений, которые до одного года до этого. Например, для ID 53, дата 1/19/2011 имеет коэффициент охвата 0,2, и я хотел бы сравнить это с средними показателями зачисления 8/17/2010 и 5/12/2010 (например, 0,15) ,
Если нет других дат в пределах идентификатора до текущего, то сравнение не должно производиться. Например, для ID 26 сравнения не было. Аналогичным образом, для ID 53 не было бы сравнения за 5/12/2010.
Когда я говорю «сравниваю», я не делаю никакого анализа или визуализации. Я просто хочу новый столбец, который принимает среднее значение этих коэффициентов зачисления до одного года до текущего (я буду их планировать и ранжировать их позже). Есть> 20 000 точек данных. Любая помощь приветствуется.