2015-03-11 3 views
1

Я совершенно новичок в R, и мне нужно R, чтобы распознать некоторые данные как двоичные. Поэтому я сделал опрос и Я бы хотел, чтобы R анализировал столбцы «Пол», «Как и Share» как двоичный код - так что я могу правильно их исправить.R - преобразовать коэффициент() в значение двоичной матрицы

head(d) 
    Gender Age Like Share 
1 Male 26 No  2 
2 Male 23 Yes  0 
3 Female 21 No  4 
4 Male 19 No  0 
5 Female 20 Yes  0 
6 Male 23 No  4 

Дело в том, что я хотел бы оценить, если есть corrolation между определенными факторами - и сделать это так, я хочу, чтобы сделать линию регрессии, которая будет выглядеть следующим образом. Но проблема в том, что я всегда получаю сообщение об ошибке

M <- ggplot(data=d,aes(x=Age,colour=Share) + geom_point()) 

Error in aes(x = Age, colour = Share) + geom_point() : 
    non-numeric argument to binary operator 

Так что, если вы могли бы помочь мне с этими двумя проблемами, которые были бы удивительным. Одна последняя вещь, я не знаю, если это может помочь, но в случае, я дам его вам ...

sapply(D,class) 
    Gender  Age  Like  Share 
"integer" "numeric" "integer" "integer" 


sapply(D,mode) 
    Gender  Age  Like  Share 
"numeric" "numeric" "numeric" "numeric" 

Спасибо большое заранее!

+0

Вы просто испортили скобку и ввели 'geom_point()' в 'ggplot()'. Вы также должны указать аргумент 'y' в' ggplot() '. Попробуйте, например,' ggplot (data = d, aes (x = Age, y = Gender, color = Share)) + geom_point() ' –

ответ

2

Самый простой способ сделать эти категории двоичная было бы что-то вроде этого:

d$GenderBinary <- 0 
d$GenderBinary[d$Gender == "Male"] <- 1 
d$LikeBinary <- 0 
d$LikeBinary[d$Gender == "Yes"] <- 1 

Не знаете, как вы ожидаете, чтобы сделать столбец с более чем две категории бинарным, хотя («Share»).

Для ошибки ggplot, похоже, что вы забыли указать переменную (ы) y (которая предположительно была бы вашей двоичной переменной).

Смежные вопросы