Итак, я пытаюсь установить случайный классификатор леса для моего набора данных. Я очень новичок в R, и я думаю, что это простая проблема форматирования.Ошибка при запуске randomForest: объект не найден
Я прочитал в текстовый файл и преобразовать мой набор данных, так что в этом формате: (вынимая конфиденциальную информацию)
>head(df.train,2)
GOLGA8A ITPR3 GPR174 SNORA63 GIMAP8 LEF1 PDE4B LOC100507043 TGFB1I1 SPINT1
Sample1 3.726046 3.4013711 3.794364 4.265287 -1.514573 7.725775 2.162616 -1.514573 -1.5145732 -1.514573
Sample2 4.262779 0.9261892 4.744096 7.276971 -1.514573 4.694769 4.707387 2.031476 -0.8325444 2.615991
...
...
CD8B FECH PYCR1 MGC12916 KCNA3 resp
Sample1 -1.514573 2.099336 3.427928 1.542951 -1.514573 1
Sample2 -1.145806 1.204241 2.846832 1.523808 1.616791 1
В сущности столбцы являются мои функции и ряды моих образцов, последний столбец является моим вектором ответа, который является столбцом факторов, соответственно.
Тогда я использую:
set.seed(1) #Set the seed in order to gain reproducibility
RF1 = randomForest(resp~., data=df.train,ntree=1000,importance=T,mtry=3)
Просто пытаются обучить РФ на моей колонке resp
, используя другие столбцы функций.
Но я получаю ошибку:
Error in eval(expr, envir, enclos) : object 'PCNA-AS1' not found
Однако, глядя в мою обучающем наборе я могу ясно найти этот столбец, например, с:
sort(unique(colnames(df.train))
Так что я не очень понимаю, ошибка или куда идти отсюда. Мои извинения, если я не задал вопрос правильным образом, спасибо за любую помощь!
Не могли бы вы сделать это воспроизводимым примером (например, предоставить образцы данных для 'df.train', которые вызывают ошибку)? – josliber