Итак, я делаю обнаружение outlier для данного набора данных. Кстати, это делается в R.Создание новой переменной для тега outlier
С помощью функции boxplot.stats (x) $ out я получаю информацию для переменной, для которой я обнаруживаю отклонения. Правильно? Я получаю значение наблюдения, которое считается выбросом.
Что я хочу сделать, так это создать новый столбец в наборе данных, который может быть двоичным и поставить 1 для наблюдений, которые являются выбросами, и 0 для тех, которые не являются выбросами.
Пример:
Var1 Var2
asd 111
dsa 15
ssa 10
aas 9
dad 10
dda 95
Допустим, наблюдение 1 и 6 обнаружен как выброс:
Var1 Var2
asd 111
dda 95
Когда я использую:
outlier <- boxplot.stats(Var2)$out
Я только получить значение из выбросы - я получаю 111 и 95 в консоли. Так .. После того, как я обнаружил эти выбросы я хочу сделать следующее:
Var1 Var2 Outlier
asd 111 1
dsa 15 0
ssa 10 0
aas 9 0
dad 10 0
dda 95 1
Это, вероятно, очень легко сделать, но я не знаю, как. Есть идеи?
Их, спасибо! Действительно элегантное решение! –