У меня есть 10 кадров данных с двумя столбцами каждый, я вызываю dataframes a, b, c, d, e, f, g, h, i и j.ранжирование нескольких кадров данных и суммирование по ним в R
Первый столбец в каждом кадре данных называется s для последовательностей, а второй - p для p-значений, соответствующих каждой последовательности. Столбец s содержит одни и те же последовательности во всех 10 кадрах данных, по существу единственное различие в p-значениях. Ниже представлена короткая версия кадра данных a, которая имеет 600 000 строк.
s p
gtcg 0.06
gtcgg 0.05
gggaa 0.07
cttg 0.05
Я хочу, чтобы ранжировать каждый dataframe по р-значение, наименьшее значение р должно получить ранг 1 и равные р-значения должны получить одинаковый ранг. Каждый кадр данных Окончательный должен быть в следующем формате:
s p_rank_a
gtcg 2
gtcgg 1
gggaa 3
cttg 1
Я использовал это, чтобы сделать одну:
< г -ранга (а $ р)
cbind (а $ s , r)
но я не очень хорошо знаком с циклами, и я не знаю, как это сделать автоматически. В конце концов, мне бы хотелось, чтобы последний файл имел столбец s и в следующем столбце сумму рангов всех рангов во всех кадрах данных для каждой конкретной последовательности. SO основном это:
s ranksum_P_a-j
gtcg 34
gtcgg 5
gggaa 5009093
cttg 499
Пожалуйста, помогите и спасибо!
Не должен ли ранг 'gggaa' быть 4 вместо 3? –