Я только что начал изучать R и работал над набором данных, который имеет 1470 случаев. Имя набора данных - ABC. Используя as.factor, я превратил категориальные переменные в качестве факторов.Функция glm не принимает правильный набор данных
Dept_1 <- as.factor(ABC$Dept)
Education_1 <- as.factor(ABC$Education)
BusinessTravel_1 <- as.factor(ABC$BusinessTravel)
После этого я разделить набор данных на поезд и test.Number случаев как для поезда и тестовых данных кажется идеальным. Затем я использую функцию GLM используя синтаксис ниже
fit = glm(attrition~Dept_1+Education_1+BusinessTravel_1,binomial(link="logit"),train)
Fit пробегов уравнения, но он запускается на выполнение по всему набору данных ABC с 1470 случаями вместо поезда набора данных 1028 записей.
Невозможно понять, в чем проблема.
результат тусклых (поезд) и тусклый (тест) верны? –
упомянуть «данные = поезд» ... а также показать код, используемый для разделения –