У меня есть набор данных со многими переменными. Интересующими являются: ID, эпизод, начало, конец, дата оценки. Примерный набор данных показанСоздание повторяющихся дат начала и окончания
ID Episode Start End AssessmentDate
1 1 1/1/2012 12/21/2012 1/1/2012
1 1 1/1/2010 12/21/2012 12/12/2012
1 1 1/1/2010 12/21/2012 12/21/2012
1 2 1/1/2013 . 1/2/2013
1 2 1/1/2013 . 2/2/2013
1 2 1/1/2013 . 3/2/2013
2 1 1/1/2012 . 4/1/2012
2 1 1/1/2010 . 5/12/2012
2 1 1/1/2010 . 6/21/2012
2 2 1/1/2013 . 7/2/2013
2 2 1/1/2013 . 8/2/2013
2 2 1/1/2013 . 9/2/2013
У меня есть даты начала для всех, но не даты окончания. Я хочу определить дату окончания каждого эпизода и каждого пациента для 10 000 пациентов. Я хочу, чтобы дата окончания была последней датой оценки для каждого номера эпизода, и я хочу, чтобы она присутствовала для каждой строки между первой и последней датами оценки.
Я читал немного о разделении набора данных на многие более мелкие части, основанные на ID и Эпизоде, но я чувствую, что должен быть более простой способ сделать это. Я новичок в R, я пришел из SAS, и проблема, подобная этой проблеме в SAS, не принесла бы мне слишком больших проблем.
Буду признателен за любые данные, которые могут возникнуть в отношении подготовки данных.
Я согласен. Возможно, вам захочется изменить данные примера на то, что лучше отражает ваши фактические данные –