У меня есть dataframe dat
как этогошаблона в R, используя grepl
P pedigree cas 1 M rs2745406 T 2 M rs6939431 A 3 M SNP_DPB1_33156641 G 4 M SNP_DPB1_33156664_G P 5 M SNP_DPB1_33156664_A A 6 M SNP_DPB1_33156664_T A
Я хочу, чтобы исключить все строки, где pedigree
столбца запускается с SNP_
и заканчивается либо G, C, T или A (_[GCTA]
). В этом случае это будут строки 4,5,6.
Как я могу достичь этого в R? Я попытался
multisnp <- which(grepl("^SNP_*_[GCTA]$", dat$pedigree)=="TRUE")
new_dat <- dat[-multisnp,]
Мой multisnp
вектор пуст, но я не могу понять, как это исправить, так что он соответствует шаблону, я хочу. Я думаю, что это неправильное использование моего шаблона *
.
Это должно выполнить эту задачу: 'dat2 <- dat [! Grepl ("^SNP _ \\. * _ [GCAT] $ ", dat $ родословная), perl = T]'. –