2015-10-22 2 views
0

У меня есть большой набор данных (38053 строк = транскрипты, 39 столбцов = образцы) Я хочу создать новый набор данных со всеми значениями выборки для определенной группы расшифров.R help-create набор данных

x= data1["698568366",] 

работает для одного транскрипта, где «698568366» это имя транскрипта

но теперь вместо одного в то время, я хочу использовать лита в 3000

Я думал Я должен быть в состоянии использовать:

data1[data1[,1] %in% 3000_m,] 

где 3000_m список в матричной форме,

, но я получаю назад

<0 Rows> (or row.names mit Length 0) 
+2

Просьба воспроизводимый пример – Thierry

+0

Try 'data1 [data1 [1] % в% c (3000_m),] '(не проверено) – akrun

+0

data1 [! data1 [, 1]% in% 3000_m,] – PatriceG

ответ

0

Здесь массивы а и б:

a = c(1:10) 
b = c(11:20) 

Создание dataframe с ними:

df = data.frame(a, b) 

Вот мой индекс в массиве:

ind = c(3, 5, 7) 

Выбрать строки inde фиксировано, как отр:

new_df = df[ind,] 

Вы не можете использовать многомерные массивы в качестве индекса (насколько я знаю).

0

Похоже, что имена ваших транскриптов на самом деле не хранятся в первом столбце вашего фрейма данных, а как имена строк.

Если это так, и если имена ваших транскриптов, представляющих интерес, хранятся в векторе myTranscripts, вы можете использовать:

x = data1[row.names(data1) %in% myTranscripts, ] 
Смежные вопросы