У меня есть несколько файлов, которые выглядят следующим образом:Слияние файлов с различными номерами строк
FILE1:
rsRNA-2312-n 2
rsRNA-6508-n 2
rsRNA-6382-n 10
rsRNA-951-n 0
rsRNA-6330-n 4
rsRNA-6330-n 11
rsRNA-1385-n 3
rsRNA-4945-n 0
rsRNA-946-n 9
file2:
rsRNA-552-n 2
rsRNA-5301-n 7
rsRNA-6487-n 0
rsRNA-4945-n 7
rsRNA-2445-n 9
rsRNA-6490-n 2
file3:
rsRNA-4946-n 1
rsRNA-5058-n 0
rsRNA-552-n 0
rsRNA-849-n 2
rsRNA-3302-n 2
rsRNA-4099-n 0
rsRNA-552-n 1
I хотел бы объединить файлы, создающие выходной файл th at имеет значения для каждого входного файла в отдельном столбце и уникальный идентификатор (столбец 1 во входном файле) в столбце 1. Если идентификатор не найден в определенном входном файле, для этого идентификатора для этого конкретного ввода счетчик должен быть 0.
выход, как (не реальные данные):
identifier file1 file2 file3
rsRNA-552-n 2 4 5
rsRNA-5301-n 7 12 2
rsRNA-6487-n 0 1 5
rsRNA-4945-n 7 12 1
rsRNA-2445-n 9 4 55
rsRNA-6490-n 2 1 0
пытается:
files <- list.files(path = "./bowtie_mapped/", pattern='rsRNA_N1_grep_cut_cutN1_grep_cut_N1_grep2_N1_grep_N1*')
merged.data.frame = Reduce(function(...) merge(..., all=T), files)
и:
do.call(rbind, lapply(files,
function(f) {
cbind(read.csv(f), file_name=f)
}))
ли rownames уникального в каждом файл? – Heroka
Некоторые row.names встречаются в более чем одном файле – user2300940
Я имел в виду, могут ли они встречаться более одного раза в одном файле, извините. – Heroka