У меня есть большие данные с 12 collumns и 600000 строк, и я хочу, чтобы заменить выбросы с помощью этой функцииЗаменить выбросы из больших данных
replace_outliers <- function(x, na.rm = TRUE, ...) {
qnt <- quantile(x, probs=c(.25,.50 ,.75), na.rm = na.rm, ...)
H <- 1.5 * IQR(x, na.rm = na.rm)
y <- x
y[x > (qnt[3] + H)] <- qnt[2]
y
}
но для цикла он собирается занять много времени, могу я сделать это быстрее без лучшего оборудования или кластера?
данных. таблица. –