У меня есть data.frame, как показано ниже:Удалить определенные строки на основе столбцов
SNP A1 A2 EFF FRQ
rs12565286 C G -0.00225985777786465 .04354
rs11804171 A T -0.00530020318295282 .04485
rs3094315 C T -0.0042551489236695 .8364
rs12562034 A G -0.00911972489527125 .09763
rs12124819 G A 0.0250148724382224 .7744
rs2980319 A T 0.0178927256033542 .1306
rs4040617 A G -0.0173263263037023 .8707
Я хотел бы удалить любую строку, которая имеет A1-A2 пар C-G, G-C, A-T, или T-A.
Например, поскольку первая строка имеет A1 = C и A2 = G, я хотел бы удалить эту строку. Я также хотел бы удалить вторую строку, потому что это пара A-T. Третья строка - это пара AG, которая хороша, поэтому я хотел бы ее сохранить.
Мой желаемый результат:
SNP A1 A2 EFF FRQ
rs3094315 C T -0.0042551489236695 .8364
rs12562034 A G -0.00911972489527125 .09763
rs12124819 G A 0.0250148724382224 .7744
rs4040617 A G -0.0173263263037023 .8707
Чтобы исключить неоднозначные SNP, посмотрите [snpflip] (https://github.com/endrebak/snpflip). – zx8754