У меня есть два файла. Первый файл имеет три столбца: SiteID, Time и ClusterNo.Сопоставление кластеров из двух файлов на основе двух столбцов
Второй файл имеет четыре столбца: SiteA_ID, SiteB_ID, Time и ClusterNo.
file1 <- data.frame("Site_ID" = sample(74000:74500, 1000, replace =TRUE), "Time" = runif(1000)*100, "ClusterNo." = sample(1:500, 1000, replace = TRUE))
file2 <- data.frame("SiteA_ID" = sample(74000:74500, 1000, replace =TRUE),"SiteB_ID" = sample(74000:74500, 1000, replace =TRUE), "Time" = runif(1000)*100, "ClusterNo." = sample(1:500, 1000, replace = TRUE))
Мы должны выяснить, какие кластеры (из file1 и file2) создается отображение таким образом, что SITE_ID из файла1 является соответствие либо с сайта (А или В) file2; и время файла1, а время файла2 имеет разницу не более 2 единиц.
Желаемый выход представляет собой файл, содержащий три колонки: ClusterNoOfFile1 и ClusterNoOfFile2 и CommonSite
[Примечание: CommonSite является общим местом file1 и file2, для которых кластеры отображения]