Мне нужно создать дихтомизированную переменную, основанную на двух факторах (можно надеяться, что это возможно).Dichotomize данные по коэффициенту
Скажем, у меня есть данные:
d <- data.frame (
agegroup = c(2,1,1,2,3,2,1,3,3,3,3,3,1,1,2,3,2,1,1,2,1,2,2,3) ,
gender = c(2,2,2,2,2,2,1,2,1,1,1,2,1,1,2,2,1,1,1,1,2,1,1,1) ,
hourwalking = c(0.3,0.5,1.1,1.1,1.1,1.2,1.2,1.2,1.3,1.5,1.7,1.8,2.1,2.1,2.2,2.2,2.3,2.4,2.4,3,3.1,3.1,4.3,5)
)
Я хотел бы создать двоичный файл (LowWalkHrs), используя гендерна и возрастную группу специфической медианы (например, когда возрастная группа = 1 и пол = 1, медиану = 2,1 (медиана была найдена с использованием excel)). В LowWalkHrs бы добавлена переменная в наборе данных, так что результат будет:
agegroup gender hourwalk LowWalkHrs
2 2 0.3 1
1 2 0.5 1
1 2 1.1 0
2 2 1.1 1
3 2 1.1 1
2 2 1.2 0
1 1 1.2 1
....
3 1 5 0
У меня есть довольно большой набор данных (~ 10k наблюдений), так что Excel находится вне вопроса.
В R Я попытался вырезать и cut2, который, кажется, не принимать фактор переменных, а также ddply, который дал мне сообщение об ошибке из (Ошибки в $<-.data.frame
(*tmp*
, «lowWalkHrs», значение = список (hourwalking = с (0,63,: замена имеет 949 строк, данные имеют 11303)
Это действительно работает, я не пробовал его на большом наборе данных, но я это сделаю. Благодаря! – user2382532
Хорошо, попробовал его с большим набором данных, и я получаю сообщение об ошибке: Ошибка в mapply (d $ agegroup, d $ gender, d $ hourwalking,: Входы нулевой длины нельзя смешивать с ненулевыми длинами. – user2382532
Да, материал в '[...]' не будет работать с отсутствующими значениями. – Thomas