Вот небольшой пример:перевода (перекодировки) ошибка в г
X1 <- c("AC", "AC", "AC", "CA", "TA", "AT", "CC", "CC")
X2 <- c("AC", "AC", "AC", "CA", "AT", "CA", "AC", "TC")
X3 <- c("AC", "AC", "AC", "AC", "AA", "AT", "CC", "CA")
mydf1 <- data.frame(X1, X2, X3)
Входной кадр данных
X1 X2 X3
1 AC AC AC
2 AC AC AC
3 AC AC AC
4 CA CA AC
5 TA AT AA
6 AT CA AT
7 CC AC CC
8 CC TC CA
Функция
# Function
atgc <- function(x) {
xlate <- c("AA" = 11, "AC" = 12, "AG" = 13, "AT" = 14,
"CA"= 12, "CC" = 22, "CG"= 23,"CT"= 24,
"GA" = 13, "GC" = 23, "GG"= 33,"GT"= 34,
"TA"= 14, "TC" = 24, "TG"= 34,"TT"=44,
"ID"= 56, "DI"= 56, "DD"= 55, "II"= 66
)
x = xlate[x]
}
outdataframe <- sapply (mydf1, atgc)
outdataframe
X1 X2 X3
AA 11 11 12
AA 11 11 12
AA 11 11 12
AG 13 13 12
CA 12 12 11
AC 12 13 13
AT 14 11 12
AT 14 14 14
Проблема, переменный ток не eaqual до 12 в выход скорее 11, аналогично для других. Просто беспорядок!
(Exta: Кроме того, я не знаю, как избавиться от rownames.)
Простейшим решением для вас может быть просто отредактировать 'x = xlate [x]' to 'x = xlate [as.character (x)]', так как это бит, вызывающий ошибку. («X» являются векторами класса «factor», а в индексировании используются целые значения фактора (а не связанные строки символов).) –
Кроме того, чтобы избавиться от имен ростов, просто введите 'rownames (mydf) <- NULL'. –