Я хотел бы суммировать следующие примеры данных в новый dataframe следующим образом:Как суммировать данные о дате по группам в R
Население, размер выборки (N), процент выполнения (%)
Sample Размер - это счет всех записей для каждой совокупности. Я могу сделать это с помощью команды table или tapply. Процент завершен процент записей с «End Дейта (все записи без„Дата окончания“предполагаются не завершена. Это где я теряюсь!
Примеры данных
sample <- structure(list(Population = structure(c(1L, 1L, 1L, 1L, 1L, 2L,
2L, 2L, 3L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 1L, 1L, 1L, 1L, 1L,
1L, 2L, 2L, 3L, 3L, 3L, 3L, 1L, 1L, 3L, 3L, 3L, 3L), .Label = c("Glommen",
"Kaseberga", "Steninge"), class = "factor"), Start_Date = structure(c(16032,
16032, 16032, 16032, 16032, 16036, 16036, 16036, 16037, 16038,
16038, 16039, 16039, 16039, 16039, 16039, 16039, 16041, 16041,
16041, 16041, 16041, 16041, 16044, 16044, 16045, 16045, 16045,
16045, 16048, 16048, 16048, 16048, 16048, 16048), class = "Date"),
End_Date = structure(c(NA, 16037, NA, NA, 16036, 16043, 16040,
16041, 16042, 16042, 16042, 16043, 16043, 16043, 16043, 16043,
16043, 16045, 16045, 16045, 16045, 16045, NA, 16048, 16048,
16049, 16049, NA, NA, 16052, 16052, 16052, 16052, 16052,
16052), class = "Date")), .Names = c("Population", "Start_Date",
"End_Date"), row.names = c(NA, 35L), class = "data.frame")
Sorry об имени dataframe. Я старался держаться просто. Я ценю решение, используя базовые функции. У меня была более сложная проблема, и ваше решение помогло мне разобраться. –