У меня есть вектор идентификаторов, которые описывают членство в группе. Каждый идентификатор появляется только один раз в списке.Извлечь определенные строки, используя R
Пример:
GO:0006169
GO:0032238
GO:0046086
GO:0006154
GO:0046085
GO:0004001
У меня также есть таблица (3 столбцов, 74985 строк, без заголовков), содержащая отдельные идентификаторов в V1 (записанная в виде числа), группа идентификаторы в V2. И краткое описание группы в V3.
Пример:
1 GO:0003674 molecular_function
1 GO:0005576 extracellular region
1 GO:0008150 biological_process
2 GO:0001869 negative regulation of complement activation, lectin pathway
2 GO:0004867 serine-type endopeptidase inhibitor activity
2 GO:0005515 protein binding
Каждый человек может принадлежать более чем одной группе, и каждая группа может иметь более одного человека в нем. В примере индивидуум 1 находится в группе GO:0003674, GO:0005576 and GO:0008150
.
Я хотел бы извлечь и сохранить из таблицы каждую строку (то есть каждую группу), где идентификатор группы совпадает с вектором идентификаторов группы. Некоторые из идентификаторов в первом векторе не совпадают в таблице. Я пробовал использовать функцию слияния, но без успеха кажется, что в группе один и тот же человек несколько раз.
Параметр ', который()' ненужно - '% в%' возвращает логическое вектор, 'ф.р. [DF $ г% в% об,]' будет делать это – alexwhan
(+1) хорошая настройка с поправкой – Raffael
Это был dataframe да. Это дает мне кое-что, но у меня, кажется, меньше людей в каждой группе по результатам, чем в исходном кадре данных. New_data = old_data [old_data $ V2% in% Vector_of_ID,] – user3000124