Я работаю с огромным количеством данных, которые состоят из выбросов. Код хорошо работает с большинством набора данных, но не работает с небольшим количеством.Немногие выбросы не удалены
В этом примере данные:
set.seed(100)
m=rnorm(200)
m[1]=100 #inserting outlier
m[2]=50
Мой код:
library(outliers)
lg=outlier(m, logical=TRUE)
for(i in 1:length(lg)){
if(lg[i]==c("TRUE")){
m[i]=NA }}
Это заменяет выбросы НСБУ. Теперь в этом случае 100 удаляется, но 50 не удаляется. То же самое происходит с моим набором данных. Я не могу понять, почему. Я хочу получить помощь по этому вопросу.
Благодарим вас за чтение.
Как определяется 'outlier'? Это не база R, AFAIK. – Andrie
Его в пакете выбросов. Отъезд? Outlier – rockswap
okay. Я добавил это. – rockswap