Я новичок в программировании и только что начал изучать R, и, следовательно, просьба угодить моему невежеству. Я сейчас в работе с данными, которые выглядят так:Поиск общих значений между парами данных
У меня есть данные в следующем формате.Для например:
заболеванияGene Symbol
ангионевротическогоFOXJ1
болезни BMYB
болезни BGATA4
Disease CMYB
Болезнь DGATA4
Есть некоторые 250 таких записей. Я хотел бы видеть данные в следующем формате:
Disease 1Common Shared Gene Символыболезнь 2
ангионевротическийMYB, FOXJ1Disease B
Болезнь CMYBболезнь Б
болезнь БGATA4болезнь Д
То, как я приближался: я разделить процесс на 3 этапа:
Шаг 1: Сделать попарные комбинации Болезни.
Шаг 2: Найдите генные символы, связанные с каждой болезнью, и назначьте их вектору.
Шаг 3: Теперь используйте функцию пересечения (% n%) на этих созданных векторах, чтобы найти общие символы генов.
Я уверен, что должно быть что-то намного проще, чем это.
Любая помощь будет оценена! Большое спасибо!
С уважением, S
Добро пожаловать к переполнению стека. Попробуйте сделать воспроизводимый пример вашей ситуации. Вы можете прочитать http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example – Chargaff